Web情報の信憑性

Web上の情報には真実の情報に加わえ, 多くの誤った情報が含まれています。

私たちは情報の信憑性をひとつのソースだけでは判断できません。いくつかの他のサイトから得た情報と比較することによって最終的な判断を下すことが一般的です。しかし, それにより多くの時間が消費されてしまいます。

そこで, コンピュータ上でいくつかの要素を用いて情報の信憑性を測っているニュースサイトもあります。
その代表的な要素3つを紹介します。

1.情報提供者の情報
情報を提供しているWebページの管理者が, 個人なのか団体なのか。また,その情報は有償なのか無料なのか。

情報提供者が団体であり, かつその情報を得るために私たちがお金を払わなければならないとしたら, その情報は非常に信頼性が高いと言えるでしょう。また, いくつかそのようなWebページを見つけてしまえばPageRankアルゴリズムによって信頼性の高い情報を提供しているWebページを見つけることができます。PageRankアルゴリズムGoogleの創業者が学生時代の論文で発表したことでも有名です。日本のことわざで言えば, 「類は類を呼ぶ」ということです。

2.テキスト情報
論調が伝聞であるかどうか。論理構成がしっかりしていて, 誤字がないか。

これは当然見なきゃいけないポイントですよね。
「〜らしい」「〜のようだ」って言われても本当かどうか信じられません。また, 誤字が多かったりするとあまり信用できなくなります。
逆に, 「〜を経験したことから…」のように書かれると, 実際に起きたことなら信頼できるじゃんと思う方も多いでしょう。

3.時間の推移による変化
情報が変化しているか。

時間が経つに伴って変化した情報があるとします。その場合, 過去の情報は信憑性が低く, 現在における情報こそが正しい可能性が高くなります。
例えば, 足利事件の犯人は菅谷さんだ!って過去に言われていようが, 私たちは彼が犯人でないと認識しているはずです。科学技術の発展に伴いこれからも様々な情報が変化します。
また, 長期間変化していない情報は変化した情報よりさらに信憑性が高くなります。ずーーーと言われてきていることは, ころころ変わる情報よりも信頼できるのではないかという仮説に基づいているのでしょう。

現在の研究ではここらへんがメジャーなようです。
誤った情報に踊らされるということはなるべく避けたいですね。