« 人と企業の真の価値を高めるヒント | トップページ | 11/6カニ漁解禁! 開高丼、食ったかー? »

Googleおそるべし スキャンデータまでインデックス

 Wordなどで作ってPDFに変換したものではなく、スキャナーで読み取って作成したPDFファイル。

 文字の部分を選択してコピーしようと思っても、テキストとして認識されず、ただの画像です。
 それを見ながらまたタイピングしなくちゃならなかったりします。

 Googleはそれをテキストとして認識してインデックスできるようになったそうです。

 OCR(Optical Character Recognition:光学式文字認識)の技術で、そこに書かれている文字を、画像ではなく文字として認識するとか。

 ただし、「まだ」精度は期待できないようです。
 「○(丸)なのか、0(ゼロ)なのかとかはコンピューターに認識させるのは難しい」と公式ブログに書かれています。

 映像や画像だけじゃなく、スキャンされたPDFにもSEO対策が必要になるかなsign02

 

clipA picture of a thousand words?(Official Google Blog)

 

おまけ

 「データを送ってください」と言ったら、Wordで作って、プリントアウトして、それをスキャンして、メールに添付して送ってきた人がいました。
 これは役所にいた頃のお話。
 懐かしい・・・。



 ブログランキングに参加しています。
 ぽちっと応援クリックすると、調子に乗っていろいろなことを書きますdownwardleft

 にほんブログ村note
 にほんブログ村 本ブログ 編集・ライター・書店員へ

 人気ブログランキングnote
 「CSMSライターが日本語を考える」から人気ブログランキングへリンクしているバナー

|

« 人と企業の真の価値を高めるヒント | トップページ | 11/6カニ漁解禁! 開高丼、食ったかー? »

CSMS・SEO・SEM」カテゴリの記事

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/470338/25151946

この記事へのトラックバック一覧です: Googleおそるべし スキャンデータまでインデックス:

« 人と企業の真の価値を高めるヒント | トップページ | 11/6カニ漁解禁! 開高丼、食ったかー? »