【大纪元2013年05月21日讯】(大纪元记者李云帆荷兰报导)荷兰特温特大学(Twente University)的研究员开发出一个在线分析工具,通过分析社交网络Twitter上面发布的内容,即可推断用户的年龄和性别。
此工具通过分析3000名发布少于140字推文的Twitter用户数据,编辑了一系列对应不同性别和年龄的单词和词组。以这个基本数据库为参照,即可分析任何一位Twitter用户的性别和年龄。
纳燕(Dong Nguyen)女士是特温特大学计算机科学专业的博士研究生,也是这个在线分析工具的开发者之一。她介绍说,“Twitter用户只需要输入他们的用户名,登录该在线分析工具,分析工具就会把该用户最后200条推文和数据库相比较,从而计算出用户的年龄和性别。”纳燕表示,男性和女性的区别是典型的。比如男人喜欢谈论足球,而女人喜欢谈论指甲。
纳燕还解释她是如何区分年龄的。她说:“在年龄方面,年轻的用户大多数时候谈论他们自己,并且使用很多表情符号。而年长的用户喜欢用较长的单词和句子。”
这个程序目前只能分析荷兰语。在分析年龄方面,平均存在4岁的差异。对于年轻的用户,会把他们估计的小4岁,而年长的用户,会把他们估计的老4岁。纳燕还说,“我们注意到35岁以上的用户使用比较一致的语言。15岁和20岁用户之间的差异比45岁和55岁用户之间的差异要大。”
特温特大学的研究员们正和荷兰语言和文化机构合作,致力于将该在线工具推广到其它语种,并适用于其它流行的社交网站,如脸书等。
责任编辑:陈熙暖