第9期吴玉章青年学术沙龙举行 探讨网络舆情与文本分析

29.12.2014  21:11

12月26日,第9期吴玉章青年学术沙龙在中国人民大学明德主楼12层第五会议室举行。本期沙龙以“网络舆情与文本分析”为主题,统计学院李扬与信息学院窦志成两位副教授进行专题分享,由统计学院李扬副教授主持,近50名青年学者参加了沙龙活动。

随着互联网技术的快速发展和网络文本数据的急剧膨胀,人们对从冗杂的网络舆情数据中准确获取所需信息的需求日益增长。要实现海量化非结构化数据的智能化自动分析流程,需涉及一系列复杂的数据检索、抓取、存储、交叉查询与分析问题。本期沙龙从计算机和统计两个角度对“网络舆情与文本分析”的概念与实现展开了介绍,给从事社会、经济和人文研究者提供了工具性的参考和研究思路。

沙龙伊始,李扬副教授对沙龙主题和窦志成副教授作了简要介绍。窦志成副教授则讲述了网络舆情的现状、自己的工作经历与兴趣以及对现代网络舆情的思考与展望。他从“”数据时代背景下的网络信息过载和现阶段搜索引擎的不够智能化出发,强调了舆情需求的无处不在,随后详细讲解了网络舆情与文本分析的多方面理论内容,并现场演示了由信息学院开发的时事探针系统,通过输入相关热点事件与词汇,展示了一系列复杂却有效的数据检索、抓取以及可视化的用户呈现。李扬副教授从现实生活的网络购物出发,讲述了“基于主题模型的半监督网络文本情感分类研究”,并以网络酒店预订与淘宝评价中评价内容为例,分析了数据检索与分析方面存在的一些不可避免性问题。

本次沙龙活动以“圆桌会议”的形式展示了开放性与包容性的学术交流模式,两位老师从现实中事例入手阐述自己的观点,其独到的见解、对网络数据的有效搜索与抓取引起了与会老师们的共鸣。