Googleおそるべし スキャンデータまでインデックス
Wordなどで作ってPDFに変換したものではなく、スキャナーで読み取って作成したPDFファイル。
文字の部分を選択してコピーしようと思っても、テキストとして認識されず、ただの画像です。
それを見ながらまたタイピングしなくちゃならなかったりします。
Googleはそれをテキストとして認識してインデックスできるようになったそうです。
OCR(Optical Character Recognition:光学式文字認識)の技術で、そこに書かれている文字を、画像ではなく文字として認識するとか。
ただし、「まだ」精度は期待できないようです。
「○(丸)なのか、0(ゼロ)なのかとかはコンピューターに認識させるのは難しい」と公式ブログに書かれています。
映像や画像だけじゃなく、スキャンされたPDFにもSEO対策が必要になるかな
A picture of a thousand words?(Official Google Blog)
おまけ
「データを送ってください」と言ったら、Wordで作って、プリントアウトして、それをスキャンして、メールに添付して送ってきた人がいました。
これは役所にいた頃のお話。
懐かしい・・・。
ブログランキングに参加しています。
ぽちっと応援クリックすると、調子に乗っていろいろなことを書きます
| 固定リンク | 0
「パソコン・インターネット」カテゴリの記事
- 『令和時代の公用文 書き方のルール』に書き忘れた話(汗;)(2021.08.10)
- Q:「ググる」って、どういう意味ですか?(2020.10.15)
- 単語登録ができない! 変換がうまくできない!(2018.10.05)
- 「Web」ネタおまとめ(2013.11.06)
- Wordpressのプラグイン覚え書き(2012.07.30)
「CSMS・SEO・SEM」カテゴリの記事
- 「もっと見る」はクリックしない(2014.09.11)
- Wordpressのプラグイン覚え書き(2012.07.30)
- 実はWeb制作のお仕事もしています(2012.01.19)
- ネイルサロンのWebマーケティング(2010.10.30)
- 「CSMSライター」でスニペット・サイトリンク(2010.10.27)
コメント