DTPオペレーターのInDesign、Javascript関連セーブデータ。ただいま過去記事の整理中のため、記事が突然消えたり現れたり、記事の内容が微妙に変わったりします。最近は主にTwitter(@subi_omu)で活動。
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
サロゲートペア文字その3 テキストエディタでサロゲートペア文字をコードポイント表記に変換
これの続きです。

テキストデータ中のサロゲートペア文字は、以前書いたとおり、正規表現検索置換機能で[\x{010000}-\x{10FFFF}]で探せます。

ですが、探した後どうするかというのが難しい。読みがわかって説明しやすい文字は「𠮷」(つちよし)くらいで、あとの文字は難読文字ばかり。目印の記号にしてInDesignに流し込んでも、元の文字をどうやって入力するかが問題になります。
それなら、サロゲートペア文字の箇所にその文字を示すコードポイントを直接記述しておいて、InDesignに流し込んだ後で元の文字に戻せればいいんじゃない?と思って、戻す方のスクリプトをひとつ前の記事で書きました。

今回はその前段階の、テキストエディタでサロゲートペア文字を「記号とUTF-16でのコードポイントの組み合わせ」に変換する方法を紹介します。

追記:
Macのテキストエディタ、CotEditor用AppleScriptも作ってもらいました!
記事の一番下に追加しました↓


私はWindowsユーザーで、テキストエディタはWindowsのMeryを使っているため、Mery専用JavaScriptマクロです。

キャプチャ151
>>続きを読む
スポンサーサイト
サロゲートペア文字その2 InDesignでコードポイント表記をサロゲートペア文字に戻す
前記事の続きです。

サロゲートペア文字がなんだろうと、要は化けやすい文字だから化けないようにひと手間かけなきゃいけない。
そのひと手間を自動的に一括で、処理できないかなー。

うん。スクリプトでやっちゃいましょう。

10/27追記:
5桁と4桁2組のコードポイント表記の両方に対応するように書き換えました。
>>続きを読む
サロゲートペア文字その1 サロゲートペア文字とは
ここの話題
「InDesignでデータ結合をするときに、特定の文字やそれ以降の文章が消える」
という現象からわかったことと対策です。

最初に話題になった、その特定の文字が「𠩤」(原の点がない)や「𠮷」(つちよし、土の下に口)だったので、最初は異体字の問題かと思っていましたが、どうやら「サロゲートペア文字」をデータ結合では扱えないというのが真相のようです。

キャプチャ08091611


サロゲートペア文字とは?
>>続きを読む
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。