偶然从人大复印报刊资料上读到一篇比较学术的论文“新闻搜索中的‘舆情峰值’——中国近年来重大矿难报道WEB页面数分析” (作者秦州,发表于《新闻界》[成都]2005年5期)。论文认为,“通常情况下,一条新闻在网上发布后,通过对这一条新闻的关键词的查询,能够迅速找到所有发布这一条新闻的WEB页面及其数量”,而且,“通过对有关新闻事件在搜索引擎中所搜索出来的WEB页面数量的统计,可以在一定程度上反映出网上的舆情”。
作者具体论述说:
从网络受众的层面看,一个新闻事件的影响主要反映在BBS或论坛里就此事件讨论的人气上,这种人气可以由BBS里同一主题的发贴数与跟贴数反映出来。从网络媒体的层面看,如果一个新闻事件的影响越大,新闻网站与其它内容网站就这一新闻事件所做的“新闻专题”与“相关新闻”的页面通常就越多。无论是BBS里的贴子数量,“新闻专题”与“相关新闻”的页面数量,最终在搜索引擎中都表现为可以搜索到的页面,并构成这一新闻事件在网上的主要内容资源。因此,通过对某一新闻事件在主流搜索引擎中的WEB页面数的科学查询、搜索与统计,可以大体反映出这一新闻事件的网上舆情……
引文中的着重符号是我加的,因为我发现这些限定用语实在是非常关键。不管论文作者出于什么样的考虑,使用这些语汇都使得文章的立论基础增添了一些严谨性。
我不通媒体与传播的学术,从普通用户的互联网应用经验中知道,第一,某些新闻事件在搜索引擎中所搜索出来的结果有可能是不被允许显示的;第二,某些新闻在BBS论坛中是有可能不被允许讨论的,发出的帖子有可能不被放行,或有可能被删除;第三,某些新闻是不被允许评论的。这三个因素所导致的直接结果就是,新闻搜索web页面数量的统计必然残缺不全,统计学上的意义很可疑。
当然,这里不是质疑作者对近年来重大矿难报道所作的WEB页面数分析。我只是认为,如果用新闻搜索来研究“舆情”或其“峰值”,具体问题具体分析的担子是很重的;研究的课题或许是很微妙的;除了量的分析,恐怕质的分析也极重要。
获得新闻搜索相对完整的统计学意义,其实也不是没有办法。比如,搜索引擎们在搜索结果中明示“据当地法律法规、政策或职能部门通知,共xx条搜索结果未予显示”,新闻评论页面或BBS论坛也给出明示,告诉我们涉及什么话题的多少个帖子没有被允许显示。我想,这么做比较有助于学术论文的撰写,比较有利于社会科学研究的繁荣。
引述的论文在网上也可以找到,作者的blog上有。
(2006.3.26)
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=793419