『敗北と死に至る道が生活』その4258
調べてみたシリーズ第三弾。職場の人からPDFの文字を選択してWordに貼り付けると文字化けしているのでどうにかならないかと言われた。その他の形式で保存のテキストファイルとして出力してみろと言ったがそれでも文字化けしている。
意外とこの現象のPDFはある。埋め込みフォントがどうのこうの言うが文字コードとフォントなんて関係ない気がするが。AdobeのFlash撤退宣言にはほっとしている。iPhoneじゃ動かないようなもんを開発するんじゃない。
脱線したが、PDFはどう頑張っても正常な文字が取れない。プロパティ見ると内容のコピーは許可されてんのに。フリーウェアやG-Driveで恐らくどうにでもなるが、職場では禁止されている。
なので、たまたまインストールされていたMS Office One NoteにPDFをドロップして印刷イメージの挿入して張り付いた画像を右クリックして「印刷イメージからテキストをコピー」したらOCR機能が働いてコピー出来た。もともと文字だったものをOCRするってなんだかなぁという感じ。人魚の半身浴は人間に見えるということ。