随着计算机网络的发展,网络舆情以爆发之势涌现,如何实现对舆情信息的分析、识别显得尤为重要。吴树芳教授的新著《网络舆情中的热点话题研究》以此为出发点展开相关研究。
网络舆情的研究范畴广、研究点多,热点话题研究属于其重要的研究分支。
从传播学的角度来看,热点话题具有如下特征:出现频率高、传播速度快、随机性强、不可预测性明显等。这些特征提高了热点话题识别研究的难度,也吸引国内外学者对其展开了深入研究。
《网络舆情中的热点话题研究》一书对热点话题识别进行了研究,指出:在理论上,如果一个话题的相关报道在短时间内大量出现,即爆发密度比较大,则该话题为热点话题的可能性就会增大;从话题的演化曲线来看,其波动的幅度越大,则其为热点话题的可能性亦会增大。在上述分析的基础上,吴树芳教授提出了融合时序性和波动性的热点话题发现方法,首先基于积分的定义计算不规则图形的面积,实现对话题相关报道的密度度量;然后依据话题演化,绘制话题的波动曲线,计算影响话题热度的峰度值;最后将二者融合计算话题的热度,实现对热点话题的识别。
为了提高热点话题识别的准确率,作者对数据预处理进行了优化:在互信息的基础上,提出了一种基于上下文信息的热点话题字典构建方法。首先通过计算话题与词之间的互信息来判断每个词对话题的表示能力;然后通过计算话题之间、话题内部报道和有判别力词之间的上下文位置关系,求解优化得到每个热点话题的初始有判别力字典;考虑到热点话题动态演化的问题,通过融入新的相关报道实现话题字典的动态更新。
吴树芳教授对热点话题识别的研究具有较强的理论价值和应用价值,提出的热点话题识别方法及优化策略,充分考虑了热点话题的特征,解决了已有研究的不足,为该领域提供了新的理论基础和研究思路。取得的研究成果可广泛应用于信息安全、金融证券、行业调研等有关领域,提高这些领域热点问题发现的准确度,具有重要的现实意义和应用前景。
本书作者吴树芳教授为情报学方向博士生导师,科研能力强,对专业研究领域的发展态势有全面的把握。其成果拓展了网络舆情领域的研究视野,期待也相信作者未来能在该领域做出新的研究成果。
作者简介:
唐万生,男,天津大学教授,博士生导师,中国系统工程学会常务理事,天津市自动化学会常务理事、系统工程专业委员会主任,天津市期刊工作者学会理事,《系统工程学报》主编,《控制与决策》编委。主持5项国家自然科学基金,主持1项教育部博士点项目,公开发表SCI期刊论文200余篇。