「記事」カテゴリーアーカイブ

紙のカタログをスマホへリニューアル

紙のカタログをスマホへ配信します。
カタログ、名簿、価格表、規格表、業界紙(新聞)等の印刷物をデータベース化し、PCやスマホで閲覧、検索を可能にします。
印刷物では得られなかった利便性の向上とコスト削減が実現します。

スライド1

紙のカタログリニューアル・メリット
紙のカタログには、以下の様な問題点があります。
・組版、印刷のコストが発生します。
・最新の情報をタイムリーに反映できません。
・持ち運びが不便です。
・検索性が良くありません。
・保管スペースが必要です。
紙のカタログをスマホへ配信することにより、上記の問題点が全て解決します。

スライド2

紙のカタログリニューアル・イメージ図
紙のカタログを元にデータベースを作成します。
データベースと言っても大袈裟なものではなくエクセルデータです。

原稿が印刷物しか無い場合のフロー
原稿 ⇒ スキャン ⇒ OCR ⇒ テキストデータ ⇒ チェック・修正 ⇒ エクセルデータ
スライド3_1

PDFデータが有る場合のフロー
PDF ⇒ テキストデータ ⇒ チェック・修正 ⇒ エクセルデータ
スライド3_2

データベース化~WEB用データ作成
カタログ(印刷物又はPDF)を元に、全データをエクセルに入力します。
エクセルの機能(関数)を用い、ほぼ自動的にWEB用データを作成します。
エクセル(データベース) ⇒ エクセル(WEB用データ)
スライド4

WEB表示用データ作成(PC・スマホ)
エクセルのWEB用シートから、WEB表示用データの元となるテキストデータを書き出します。
テキストデータを元に、WEB表示用データ(PC・スマホ)を作成します。
利便性の向上を図るため、カテゴリ分けやキーワード検索ができるようにします。
スライド5

データベース化~印刷用データ作成
エクセル(データベース)は、WEB用データと同様に印刷用データとしても活用できます。
エクセルの機能(関数)を用い、ほぼ自動的に印刷用データを作成します。
エクセル(データベース) ⇒ エクセル(印刷用データ)
スライド6

印刷用データ作成(ワード・PDF)
エクセルの印刷用シートから、印刷用データの元となるテキストデータを書き出します。
テキストデータをワードに読み込み、編集作業を行います。
ワードの編集作業が完了したら、印刷用PDFデータの書き出しを行います。
スライド7

エクセルをWEB・スマホへ
excel
エクセルデータをWEBへアップし、カテゴリ分けや検索ができるようにします。
WEB画面は、スマホからもほぼ同じ状態で見ることができます。
wp
スマホで以下のQRコードを読み取ると、サンプルサイトが表示されます。
QRcode

ページめくりができるPDF

ページめくりができるPDFのサンプルページです。
代表的なものを3種類ご紹介します。

「速ワザ」は、しおり機能、オリジナルPDFのダウンロード機能等もあり、高性能の割には低価格なのでお勧めのアプリケーションソフトです。
「速ワザ」と「aXmag」は体験版で作成しましたが、機能や使い勝手、デザイン等は正規版と同等です。
「issuu」は、デジタル出版プラットフォームと呼ばれるサービスで、基本的に無料で利用できますが、広告無しの有料サービスも行なっており、サイトへの埋め込みにも対応しています。
海外サイト(英語表記)のため、機能やサービスの詳細については未確認です。

> 業務案内 速ワザ
> 業務案内 aXmag
> 業務案内 issuu

大きな表をインポートする

エクセルで作成した大きめの表をインポートしました。
先頭の5件にハイパーリンクを付けましたが、これはエクセルの段階でHTMLタグを付加したものです。
表をCSV形式で保存し、テキストエディタでUTF-8コードに変更して保存し直します。

TablePressでCSVデータをインポートし、ショートコードを記事へ貼り付けます。
表示する件数を指定できるので、かなり大きな表を一つの記事として取り込むことも可能です。
検索機能も優れており、これだけでちょっとしたデータベースとして使えそうです。

 議員氏名読み方会派選挙区任期満了
アントニオ 猪木あんとにお いのき維結比例2019/7/28
[猪木 寛至]
足立 信也あだち しんや民主大分2016/7/25
相原 久美子あいはら くみこ民主比例2019/7/28
愛知 治郎あいち じろう自民宮城2019/7/28
青木 一彦あおき かずひこ自民島根2016/7/25
赤池 誠章あかいけ まさあき自民比例2019/7/28
赤石 清美あかいし きよみ自民比例2016/7/25
秋野 公造あきの こうぞう公明比例2016/7/25
東  徹あずま とおる維結大阪2019/7/28
荒井 広幸あらい ひろゆき改革比例2016/7/25
荒木 清寛あらき きよひろ公明比例2016/7/25
有田 芳生ありた よしふ民主比例2016/7/25
有村 治子ありむら はるこ自民比例2019/7/28
井上 哲士いのうえ さとし共産比例2019/7/28
井上 義行いのうえ よしゆきみん比例2019/7/28
井原  巧いはら たくみ自民愛媛2019/7/28
石井 準一いしい じゅんいち自民千葉2019/7/28
石井 浩郎いしい ひろお自民秋田2016/7/25
石井 正弘いしい まさひろ自民岡山2019/7/28
石井 みどりいしい みどり自民比例2019/7/28
石上 俊雄いしがみ としお民主比例2019/7/28
石川 博崇いしかわ ひろたか公明大阪2016/7/25
石田 昌宏いしだ まさひろ自民比例2019/7/28
石橋 通宏いしばし みちひろ民主比例2016/7/25
磯崎 仁彦いそざき よしひこ自民香川2016/7/25
礒崎 哲史いそざき てつじ民主比例2019/7/28
礒崎 陽輔いそざき ようすけ自民大分2019/7/28
市田 忠義いちだ ただよし共産比例2016/7/25
糸数 慶子いとかず けいこ無所属沖縄2019/7/28
猪口 邦子いのぐち くにこ自民千葉2016/7/25
岩井 茂樹いわい しげき自民静岡2016/7/25
岩城 光英いわき みつひで自民福島2016/7/25
宇都 隆史うと たかし自民比例2016/7/25
上野 通子うえの みちこ自民栃木2016/7/25
魚住 裕一郎うおずみ ゆういちろう公明比例2019/7/28
江口 克彦えぐち かつひこみん比例2016/7/25
江崎  孝えさき たかし民主比例2016/7/25
江島  潔えじま きよし自民山口2016/7/25
江田 五月えだ さつき民主岡山2016/7/25
衛藤 晟一えとう せいいち自民比例2019/7/28
小川 勝也おがわ かつや民主北海道2019/7/28
小川 敏夫おがわ としお民主東京2016/7/25
小野 次郎おの じろう維結比例2016/7/25
尾立 源幸おだち もとゆき民主大阪2016/7/25
尾辻 秀久おつじ ひでひさ自民鹿児島2019/7/28
大家 敏志おおいえ さとし自民福岡2016/7/25
大久保 勉おおくぼ つとむ民主福岡2016/7/25
大島 九州男おおしま くすお民主比例2019/7/28
大塚 耕平おおつか こうへい民主愛知2019/7/28
大沼 みずほおおぬま みずほ自民山形2019/7/28
[亀  瑞穂]
大野 元裕おおの もとひろ民主埼玉2016/7/25
大野 泰正おおの やすただ自民岐阜2019/7/28
太田 房江おおた ふさえ自民比例2019/7/28
[齊藤 房江]
岡田 直樹おかだ なおき自民石川2016/7/25
岡田  広おかだ ひろし自民茨城2016/7/25
加藤 敏幸かとう としゆき民主比例2016/7/25
風間 直樹かざま なおき民主新潟2019/7/28
片山 さつきかたやま さつき自民比例2016/7/25
片山 虎之助かたやま とらのすけ維結比例2016/7/25
金子 原二郎かねこ げんじろう自民長崎2016/7/25
金子 洋一かねこ よういち民主神奈川2016/7/25
神本 美恵子かみもと みえこ民主比例2019/7/28
紙  智子かみ ともこ共産比例2019/7/28
[内山 智子]
川田 龍平かわだ りゅうへい維結比例2019/7/28
河野 義博かわの よしひろ公明比例2019/7/28
木村 義雄きむら よしお自民比例2019/7/28
吉良 よし子きら よしこ共産東京2019/7/28
[吉良 佳子]
儀間 光男ぎま みつお維結比例2019/7/28
岸  宏一きし こういち自民山形2016/7/25
北川 イッセイきたがわ いっせい自民大阪2016/7/25
[北川 一成]
北澤 俊美きたざわ としみ民主長野2016/7/25
北村 経夫きたむら つねお自民比例2019/7/28
熊谷  大くまがい ゆたか自民宮城2016/7/25
倉林 明子くらばやし あきこ共産京都2019/7/28
郡司  彰ぐんじ あきら民主茨城2016/7/25
小池  晃こいけ あきら共産比例2019/7/28
小泉 昭男こいずみ あきお自民神奈川2016/7/25
小坂 憲次こさか けんじ自民比例2016/7/25
小西 洋之こにし ひろゆき民主千葉2016/7/25
小林 正夫こばやし まさお民主比例2016/7/25
小見山 幸治こみやま よしはる民主岐阜2016/7/25
古賀 友一郎こが ゆういちろう自民長崎2019/7/28
上月 良祐こうづき りょうすけ自民茨城2019/7/28
行田 邦子こうだ くにこみん埼玉2019/7/28
[山崎 邦子]
鴻池 祥肇こうのいけ よしただ自民兵庫2019/7/28
輿石  東こしいし あずま無所属山梨2016/7/25
佐々木 さやかささき さやか公明神奈川2019/7/28
佐藤 信秋さとう のぶあき自民比例2019/7/28
佐藤 正久さとう まさひさ自民比例2019/7/28
佐藤 ゆかりさとう ゆかり自民比例2016/7/25
斎藤 嘉隆さいとう よしたか民主愛知2016/7/25
酒井 庸行さかい やすゆき自民愛知2019/7/28
櫻井  充さくらい みつる民主宮城2016/7/25
山東 昭子さんとう あきこ自民比例2019/7/28
清水 貴之しみず たかゆき維結兵庫2019/7/28
芝  博一しば ひろかず民主三重2016/7/25
柴田  巧しばた たくみ維結比例2016/7/25
島尻 安伊子しまじり あいこ自民沖縄2016/7/25
島田 三郎しまだ さぶろう自民島根2019/7/28
島村  大しまむら だい自民神奈川2019/7/28
主濱  了しゅはま りょう生活岩手2016/7/25
榛葉 賀津也しんば かづや民主静岡2019/7/28
末松 信介すえまつ しんすけ自民兵庫2016/7/25
杉  久武すぎ ひさたけ公明大阪2019/7/28
世耕 弘成せこう ひろしげ自民和歌山2019/7/28
関口 昌一せきぐち まさかず自民埼玉2016/7/25
田城  郁たしろ かおる民主比例2016/7/25
田中  茂たなか しげるみん比例2016/7/25
田中 直紀たなか なおき民主新潟2016/7/25
田村 智子たむら ともこ共産比例2016/7/25
伊達 忠一だて ちゅういち自民北海道2019/7/28
大門 実紀史だいもん みきし共産比例2016/7/25
高階 恵美子たかがい えみこ自民比例2016/7/25
高野 光二郎たかの こうじろう自民高知2019/7/28
高橋 克法たかはし かつのり自民栃木2019/7/28
滝沢  求たきさわ もとめ自民青森2019/7/28
滝波 宏文たきなみ ひろふみ自民福井2019/7/28
竹谷 とし子たけや としこ公明東京2016/7/25
[菊地 とし子]
武見 敬三たけみ けいぞう自民東京2019/7/28
辰已 孝太郎たつみ こうたろう共産大阪2019/7/28
谷  亮子たに りょうこ生活比例2016/7/25
谷合 正明たにあい まさあき公明比例2016/7/25
柘植 芳文つげ よしふみ自民比例2019/7/28
津田 弥太郎つだ やたろう民主比例2016/7/25
塚田 一郎つかだ いちろう自民新潟2019/7/28
鶴保 庸介つるほ ようすけ自民和歌山2016/7/25
寺田 典城てらた すけしろ維結比例2016/7/25
堂故  茂どうこ しげる自民富山2019/7/28
徳永 エリとくなが えり民主北海道2016/7/25
[鈴木 エリ]
豊田 俊郎とよだ としろう自民千葉2019/7/28
那谷屋 正義なたにや まさよし民主比例2016/7/25
直嶋 正行なおしま まさゆき民主比例2016/7/25
中泉 松司なかいずみ まつじ自民秋田2019/7/28
中川 雅治なかがわ まさはる自民東京2016/7/25
中曽根 弘文なかそね ひろふみ自民群馬2016/7/25
中西 健治なかにし けんじみん神奈川2016/7/25
中西 祐介なかにし ゆうすけ自民徳島2016/7/25
中野 正志なかの まさし維結比例2019/7/28
中原 八一なかはら やいち自民新潟2016/7/25
中山 恭子なかやま きょうこ維結比例2019/7/28
長沢 広明ながさわ ひろあき公明比例2016/7/25
長浜 博行ながはま ひろゆき民主千葉2019/7/28
長峯  誠ながみね まこと自民宮崎2019/7/28
難波 奨二なんば しょうじ民主比例2016/7/25
二之湯 智にのゆ さとし自民京都2016/7/25
二之湯 武史にのゆ たけし自民滋賀2019/7/28
仁比 聡平にひ そうへい共産比例2019/7/28
新妻 秀規にいづま ひでき公明比例2019/7/28
西田 昌司にしだ しょうじ自民京都2019/7/28
西田 実仁にしだ まこと公明埼玉2016/7/25
西村 まさみにしむら まさみ民主比例2016/7/25
[山本 正美]
野上 浩太郎のがみ こうたろう自民富山2016/7/25
野田 国義のだ くによし民主福岡2019/7/28
野村 哲郎のむら てつろう自民鹿児島2016/7/25
羽田 雄一郎はた ゆういちろう民主長野2019/7/28
羽生田 俊はにゅうだ たかし自民比例2019/7/28
長谷川 岳はせがわ がく自民北海道2016/7/25
馬場 成志ばば せいし自民熊本2019/7/28
白  眞勲はく しんくん民主比例2016/7/25
橋本 聖子はしもと せいこ自民比例2019/7/28
[石崎 聖子]
浜田 和幸はまだ かずゆき改革鳥取2016/7/25
浜田 昌良はまだ まさよし公明比例2016/7/25
浜野 喜史はまの よしふみ民主比例2019/7/28
林 久美子はやし くみこ民主滋賀2016/7/25
[世耕 久美子]
林  芳正はやし よしまさ自民山口2019/7/28
平木 大作ひらき だいさく公明比例2019/7/28
平野 達男ひらの たつお改革岩手2019/7/28
広田  一ひろた はじめ民主高知2016/7/25
福岡 資麿ふくおか たかまろ自民佐賀2016/7/25
福島 みずほふくしま みずほ社民比例2016/7/25
[福島 瑞穂]
福山 哲郎ふくやま てつろう民主京都2016/7/25
藤井 基之ふじい もとゆき自民比例2016/7/25
藤川 政人ふじかわ まさひと自民愛知2016/7/25
藤末 健三ふじすえ けんぞう民主比例2016/7/25
藤田 幸久ふじた ゆきひさ民主茨城2019/7/28
藤巻 健史ふじまき たけし維結比例2019/7/28
藤本 祐司ふじもと ゆうじ民主静岡2016/7/25
古川 俊治ふるかわ としはる自民埼玉2019/7/28
堀井  巌ほりい いわお自民奈良2019/7/28
堀内 恒夫ほりうち つねお自民比例2016/7/25
真山 勇一まやま ゆういち維結比例2016/7/25
舞立 昇治まいたち しょうじ自民鳥取2019/7/28
前川 清成まえかわ きよしげ民主奈良2016/7/25
前田 武志まえだ たけし民主比例2016/7/25
牧野 たかおまきの たかお自民静岡2019/7/28
[牧野 京夫]
牧山 ひろえまきやま ひろえ民主神奈川2019/7/28
[牧山 弘惠]
増子 輝彦ましこ てるひこ民主福島2016/7/25
又市 征治またいち せいじ社民比例2019/7/28
松沢 成文まつざわ しげふみみん神奈川2019/7/28
松下 新平まつした しんぺい自民宮崎2016/7/25
松田 公太まつだ こうたみん東京2016/7/25
松村 祥史まつむら よしふみ自民熊本2016/7/25
松山 政司まつやま まさじ自民福岡2019/7/28
丸川 珠代まるかわ たまよ自民東京2019/7/28
[大塚 珠代]
丸山 和也まるやま かずや自民比例2019/7/28
三木  亨みき とおる自民徳島2019/7/28
三原 じゅん子みはら じゅんこ自民比例2016/7/25
[三原 順子]
三宅 伸吾みやけ しんご自民香川2019/7/28
水岡 俊一みずおか しゅんいち民主兵庫2016/7/25
水落 敏栄みずおち としえい自民比例2016/7/25
水野 賢一みずの けんいちみん千葉2016/7/25
溝手 顕正みぞて けんせい自民広島2019/7/28
宮沢 洋一みやざわ よういち自民広島2016/7/25
宮本 周司みやもと しゅうじ自民比例2019/7/28
室井 邦彦むろい くにひこ維結比例2019/7/28
森 まさこもり まさこ自民福島2019/7/28
[三好 雅子]
森本 真治もりもと しんじ民主広島2019/7/28
森屋  宏もりや ひろし自民山梨2019/7/28
矢倉 克夫やくら かつお公明埼玉2019/7/28
薬師寺 みちよやくしじ みちよみん愛知2019/7/28
[齋藤 道代]
安井 美沙子やすい みさこ民主愛知2016/7/25
柳澤 光美やなぎさわ みつよし民主比例2016/7/25
柳田  稔やなぎだ みのる民主広島2016/7/25
柳本 卓治やなぎもと たくじ自民大阪2019/7/28
山口 和之やまぐち かずゆきみん比例2019/7/28
山口 那津男やまぐち なつお公明東京2019/7/28
山崎  力やまざき つとむ自民青森2016/7/25
山崎 正昭やまざき まさあき無所属福井2016/7/25
山下 雄平やました ゆうへい自民佐賀2019/7/28
山下 芳生やました よしき共産比例2019/7/28
山田 修路やまだ しゅうじ自民石川2019/7/28
山田 太郎やまだ たろうみん比例2016/7/25
山田 俊男やまだ としお自民比例2019/7/28
山谷 えり子やまたに えりこ自民比例2016/7/25
[小川 惠里子]
山本 一太やまもと いちた自民群馬2019/7/28
山本 香苗やまもと かなえ公明比例2019/7/28
[池田 香苗]
山本 順三やまもと じゅんぞう自民愛媛2016/7/25
山本 太郎やまもと たろう無所属東京2019/7/28
山本 博司やまもと ひろし公明比例2019/7/28
横山 信一よこやま しんいち公明比例2016/7/25
吉川 沙織よしかわ さおり民主比例2019/7/28
吉川 ゆうみよしかわ ゆうみ自民三重2019/7/28
[吉川 有美]
吉田 忠智よしだ ただとも社民比例2016/7/25
吉田 博美よしだ ひろみ自民長野2019/7/28
蓮舫れんほう民主東京2016/7/25
[村田 蓮舫]
和田 政宗わだ まさむねみん宮城2019/7/28
若林 健太わかばやし けんた自民長野2016/7/25
若松 謙維わかまつ かねしげ公明比例2019/7/28
脇  雅史わき まさし自民比例2016/7/25
渡辺 猛之わたなべ たけゆき自民岐阜2016/7/25
渡辺 美知太郎わたなべ みちたろうみん比例2019/7/28
渡邉 美樹わたなべ みき自民比例2019/7/28

エクセルをワードプレスへインポート

エクセルの表をワードプレスへインポートすることができます。
TablePressやコピー&ペーストで貼り付ける方法ではなく、エクセル1件(1行)が1記事(1投稿)になります。
1件の情報量が多く、文章情報以外に画像やPDFを含むような場合を想定しました。

一括で大量のエクセルデータをインポートする場合に有効な方法です。
エクセル側に指定できるのは、タイトル、カテゴリー、日付、内容(記事)、キーワード(タグ)です。
また、内容(記事)には文章だけではなく、HTMLタグやURLを指定することができます。
Movable Type and TypePad Importer というプラグインを使用します。

■ エクセルデータ(インポート前)
excel

■ ワードプレス(インポート後)
touko
 
エクセルの内容(記事)の項目は、商品説明、価格、商品画像のURL等、複数項目に分割することも可能です。PDFを格納しているURLを指定すれば、PDFの埋め込みやハイパーリンクを作成することもできます。
エクセルの関数とマクロを組み合わせてMovableType形式に書き出しているので、ワードプレスのツール→インポート→MovableType…を実行すれば任意のカテゴリーに記事が新規追加されます。

ワード埋め込みサンプル

OneDrive(以前のSkyDrive)は、あらゆるデータを7GBの共有スペースに保管、参照、管理できるクラウドサービスです。
PC、Mac、タブレット、スマートフォンなどのデバイスを利用して、どこからでも無料で写真、動画、ドキュメントなどのファイルを簡単に保存できます。

OneDriveへアップロードしたデータは、ワードプレスへ埋め込みができるので、ファイルをオープンせずに内容を参照することができます。
また、ファイル名や説明文などを付加すれば、該当のデータを簡単に検索することができます。

検索キー:書類送付ご案内

検索キー:秘密保持に関する誓約書

OCR後チェック・修正の課題

最近のOCRソフトには、PDFやテキスト以外にオフィス系アプリ(ワード、エクセル、パワーポイント)へ保存できるものが沢山あります。
しかし、オフィス系アプリへ変換を行い、すぐに利用できるほど変換精度の高いOCRソフトはほとんどありません。
チェック・修正、特にレイアウト等の修正に膨大な時間をかけるくらいならば、最初から作り直した方がマシではないか…というケースも決して少なくありません。
そこで、お勧めしているのは「OCRかけっぱなし」と「しおりの自動付加」です。
これならば、全文検索としおりの活用ができ、納期面・コスト面共に納得いただけるのではないでしょうか。
もう少し検索の精度を高めたいならば、見出しレベル(章・節・項…)だけチェック・修正を行うという方法があります。
また、文字化けやあきらかな読取りエラーだけ修正する方法もあります。
「e.Typist」には全文解析という機能があり、疑わしい語句だけ拾い出すことができます。
これはワードの校正ツールに似たものですが、「読んde!!ココ」や「読取革命」等他のOCRソフトにはない機能です。
「e.Typist」には、全文解析以外に置換リストという機能もあり、これは置換前、置換後の文字列をテキストデータとして保存し、一括で置換を行うことができます。
これらのツールを活用すれば、それほど手間をかけずにある程度の品質向上が図れます。
どうしてもオフィス系のデータとして再利用したい場合には、テキスト、図、表の各要素に分類して、テキストデータ、イメージデータ、エクセルデータとして完成させた後に、オフィス系アプリへ統合する方法があります。
いきなりオフィス系アプリ(ワード、エクセル、パワーポイント)に変換して、チェック・修正、レイアウト修正を行うよりは、いくらかは作業が軽減できると思います。
いずれにしても、どこまで時間とコストを捻出できるのかによるのではないでしょうか。

スキャン後の画像補正(白黒の場合)

ADF付きスキャナの場合、断裁済みの原稿を読み込むので、元々曲がりが発生しにくい上、スキャナ自体に曲がり補正機能を有していることがあります。
そのため、敢えて曲がり補正(水平補正)を意識することは少ないかも知れません。
一方、手置きスキャナ(フラットベッドスキャナ)の場合は、ほぼ100%曲がりが発生するので、曲がり補正(水平補正)の工程は必須と言って良いでしょう。
しかし、曲がり補正ができるソフトウェアは意外に少なく、これまでは「読んde!!ココ」の曲がり補正を利用することがありました。
ところが、「読んde!!ココ」のPDF保存に問題があることが判ったため、さてどうしたものか…と思っていました。
その後、アクロバットXIに曲がり補正の機能があることに気が付きました。
「ゆがみ補正」という名称で、少々判りにくい場所にあります。

tool.gif

ツール→スキャンされたPDFを最適化→フィルター→ゆがみ補正
ゆがみ補正を「オン」にすると、PDFの曲がりを補正してくれることが判りました。

settei.gif

アクロバットのオンラインヘルプによると、最適化オプションのアダプティブ圧縮を適用とは、「各ページを白黒、グレースケール、カラーの領域に分割し、種類別に高い圧縮率で圧縮する一方で、見た目をほとんど変えずに表示します。」とありますので、チェックを入れておいた方が良いでしょう。
カラー/グレースケールについては、JPEG2000、ZIP、JPEGの3種類がありますが、どれも「圧縮をカラー画像コンテンツに適用します。」としか記述がないので、最も画質の劣化が少なそうなZIPを選択します。
白黒は、JBIG2(劣化なし)、JBIG2(劣化あり)、CCITT Group 4の3種類があります。JBIG2(劣化なし)はCCITT Group 4よりも60%の高圧縮が可能ですが、処理速度の低下、品質の劣化、Acrobat 5.0(PDF 1.4)以前のデータとの非互換等があるため、CCITT Group 4の選択をお勧めします。
高圧縮/高品質は、ファイルサイズの圧縮率と画質のバランスを設定します。
画質が気になる場合は、高品質にしておくのが無難かも知れません。
ゆがみ補正は、「スキャナーのガラス面の両端に対してページが平行に置かれていない場合、スキャンで生成されるPDFページがまっすぐになるように傾きを補正します。」とあり、これが曲がり補正(水平補正)のオプションであることが判ります。「オン」または「オフ」を選択します。
背景を除去の説明は次の通りです。
グレースケール画像やカラー画像を取り込むときに、白に近い色を白くします(白黒の画像には影響しません)。最適な結果を得るには、通常の白黒ページのテキストが濃い灰色または黒で、背景が白になるように、スキャナーのコントラストと明るさの設定をキャリブレーションします。次に、オプションを「オフ」または「低」にすると、適切な結果が得られます。オフホワイトの用紙または新聞用紙の場合は、「中」または「高」を選択します。
デフォルトは「オフ」です。
モアレフィルターの説明は次の通りです。
JPEG圧縮率を低下させ、モアレパターンを生じ、テキストを読みづらくする原因となるハーフトーンのドットを削除します。200~400dpiのグレースケール画像かRGB画像に適しています。また、アダプティブ圧縮の場合、400~600dpiの白黒画像に適しています。「オン」の設定(推奨)は300dpi以上のグレースケール画像とRGB画像のフィルターに適用します。 画像や塗りつぶされた領域がないページをスキャンするとき、または有効な範囲より高い解像度でスキャンするときは、「オフ」を選択します。
デフォルトは「オン」です。
テキストシャープニングの説明は次の通りです。
スキャンされたPDFファイルのテキストを鮮明にします。デフォルト値の「低」が多くの文書に適してします。印刷された文書の品質が低く、テキストが不明瞭な場合は「中」または「高」にあげます。
デフォルトは「低」です。

「読んde!!ココ」の傾き補正に関する問題点

「読んde!!ココ」はOCRソフトですが、スキャン画像の傾き補正機能だけを使用することもできます。
単ページはもちろんですが、左右見開きページの傾き補正もできるので大変重宝しています。
自動傾き補正の機能がなかなか強力なので、大量のデータ処理が必要な時など、OCRファクトリーを使ってフォルダ単位に一括でスキャン画像の傾き補正を行うことができます。
また、白黒、カラー共に傾き補正後の品質劣化が少ない点もメリットとして挙げられると思います。
難点としては、PDFの読み込み、書き出しに時間がかかることと、保存するPDFのファイルサイズが大きくなることです。
しかし、意外な問題点が発覚しました。
保存するPDFのファイルサイズが大きいことには気付いていましたが、XEROXやキャノン、シャープ等のスキャナで作成するPDFは独自の圧縮技術を用いているので、「読んde!!ココ」で保存する際に圧縮が解除されているのかな?…くらいにしか考えていませんでした。
「読んde!!ココ」でPDF保存を行う場合、PDFのオプションは選択することができません。
まさか、白黒モードがRGBモードのPDFに変わっているとは考えもしませんでした。
納品後にお客様から指摘を受けた時は、本当に背筋に悪寒が走りました。
次に、RGBモードのPDFを、品質を劣化させずに白黒モードへ戻すにはどうすれば良いのか?…という問題に突き当たりました。
なかなか良い方法が見つからず困っておりましたが、フォトショップを使えばどうにかできそうだ…ということが判りました。
手順としては、まずPDFをアクロバットで単ページに分割し、次にフォトショップでRGBをグレースケールに落とし、さらにモノクロ2階調へ落とします。
その時、種類は「50%を基準に2階調に分ける」を選択します。
これらをアクションに記録し、フォルダ単位にバッチ処理を走らせました。
上記の処理を行い、RGBモードのPDFを白黒モードへ一括変換しました。
品質は残念ながら少々劣化しましたが、幸い許容範囲内でしたので事なきを得ました。
元々は私の確認不足が原因ではありますが、「読んde!!ココ」のPDF保存にはこのような問題点があるのでご注意ください。

スキャン後の画像補正(カラーの場合)

スキャン対象がカラー原稿で、しかも仕上がりに高品質を求められる場合、断裁可・不可に関わらずADFは使わず手置きスキャナを使用しています。
白黒原稿ならばアクロバットのプラグインを使い、汚れや影の部分にマスク処理を施せば済みますが、カラー原稿の場合はフォトショップで補正を加える必要があります。
特に、原稿が断裁不可で用紙に厚みがあったり、ページ数が多いものは非常に厄介です。
左下の画像の様に、ページの中央付近に白っぽい帯状のテカりが出ることがあり、これを右下の画像のように目立たなく補正しなければなりません。

P2.gif
P5.gif

この補正処理は、なかなか手間がかかります。
良い方法はないか色々試行錯誤しておりますが、どうもこれといった決め手が見つかりません。
作業時間に見合ったコストをご負担いただければ良いのですが、なかなかそうも行きませんのでなるべく原稿の断裁をお願いしています。
フォトショップの機能を駆使すればある程度の時間短縮は可能ですが、要求品質の水準が高度な場合には少々無理が生じるかも知れません。
モニターで見る限り十分に高品質なレベルであり、なるべく手間をかけずリーズナブルなコストでのご提供を目指しております。
下の例などもよく見ると少々変ですが、品質・コスト・時間との兼ね合いということでご容赦ください。

P6.gif
P8.gif

しおりのエクセル読み込み、HTML書き出し

文書をスキャンしてPDFを作成する場合、しおりを付けずに納品するケースがあります。その際、検索ができるようにOCR処理を行ない、透明テキスト付きPDFにします。
また、PDFを見出し単位に分割して保存し、見出しをエクセルに入力して、該当のPDFへハイパーリンク設定を行なう場合もあります。ハイパーリンクの設定は、VBA又はハイパーリンク関数を用いて行います。
次のケースは、エクセルに入力したしおり名、ページ、階層の情報を、しおりの付いていないPDFへ一括で付加する例です。JavaScriptを用いて、自動処理でPDFへしおりを付加します。

■階層なし(エクセル→PDF)

excel_1.gif
pdf_1.gif

■階層あり(エクセル→PDF)

excel_2.gif
pdf_2.gif

この方法ならば、これまでOCR処理しか行なっていなかったPDFへも、手間をかけずにしおりを付加できるので利便性の向上が図れ、PDFを分割したりハイパーリンク設定を行なう手間も省略できます。
また、しおり付きのPDFからしおりの情報を抽出し、HTMLへ書き出すことができます。HTMLのリンク先はPDFのしおりページです。
PDFを分割しなくても、該当のしおりページへリンクすることができます。
Webページやブログに組み込んでしおりページへリンクさせたり、目次ページを作成する等の使い方もできます。
一旦、しおりの情報をエクセルへ書き出してから、関数を使ってHTMLタグを付け加えています。

■階層なし(PDF→エクセル→HTML)

mokuji_1.gif

目次

Total Documentation Solution ….. P1
ローカリゼーションDTP ….. P2
InDesign/FrameMaker DTP ….. P3
デザイン系DTP ….. P5
翻訳 ….. P6

■階層あり(PDF→エクセル→HTML)

mokuji_3.gif

目次

Total Documentation Solution ….. P1
 ローカリゼーションDTP ….. P2
  InDesign/FrameMaker DTP ….. P3
   デザイン系DTP ….. P5
翻訳 ….. P6