荷兰开发Twitter用户年龄性别分析工具

人气 7

【大纪元2013年05月21日讯】(大纪元记者李云帆荷兰报导)荷兰特温特大学(Twente University)的研究员开发出一个在线分析工具,通过分析社交网络Twitter上面发布的内容,即可推断用户的年龄和性别。

此工具通过分析3000名发布少于140字推文的Twitter用户数据,编辑了一系列对应不同性别和年龄的单词和词组。以这个基本数据库为参照,即可分析任何一位Twitter用户的性别和年龄。

纳燕(Dong Nguyen)女士是特温特大学计算机科学专业的博士研究生,也是这个在线分析工具的开发者之一。她介绍说,“Twitter用户只需要输入他们的用户名,登录该在线分析工具,分析工具就会把该用户最后200条推文和数据库相比较,从而计算出用户的年龄和性别。”纳燕表示,男性和女性的区别是典型的。比如男人喜欢谈论足球,而女人喜欢谈论指甲。

纳燕还解释她是如何区分年龄的。她说:“在年龄方面,年轻的用户大多数时候谈论他们自己,并且使用很多表情符号。而年长的用户喜欢用较长的单词和句子。”

这个程序目前只能分析荷兰语。在分析年龄方面,平均存在4岁的差异。对于年轻的用户,会把他们估计的小4岁,而年长的用户,会把他们估计的老4岁。纳燕还说,“我们注意到35岁以上的用户使用比较一致的语言。15岁和20岁用户之间的差异比45岁和55岁用户之间的差异要大。”

特温特大学的研究员们正和荷兰语言和文化机构合作,致力于将该在线工具推广到其它语种,并适用于其它流行的社交网站,如脸书等。

责任编辑:陈熙暖

相关新闻
Twitter或审查 美国政府关注 艾未未警告退出
中国人权事务中心就twitter启言论审查的声明
研究:社交媒体比烟酒更容易上瘾
Twitter自审 网友“熄灯”
如果您有新闻线索或资料给大纪元,请进入安全投稿爆料平台
评论