1月11日,今日头条召开了一场旨在推动整个行业来问诊算法、建言算法的分享交流会。
资深算法架构师、中国科学技术大学计算机博士曹欢欢,在今日头条总部带来了题为《让算法公开透明》的分享,讲解了今日头条推荐算法的基本原理,并详细介绍了算法模型设计维度与策略,包括如何在线训练大规模推荐模型,典型召回策略的设计方法,多目标如何融合等核心问题。
曹欢欢谈到,语义标签的效果,是检查一个公司 NLP(自然语言处理)的试金石。
语义标签要投入很多标注,而且需要迭代标注。比如,去年标的科技的文章,今年可能不能涵盖了,很多新的名词,哪天冒了区块链,哪天冒出来新零售,这是科技行业的新概念,要不断标注,投入的资源和难度都很大。
“隐式的语义特征已经做得很好,为什么还要自己标注语义标签?”曹欢欢解释道:“频道、兴趣表达等重要产品功能,需要一个有明确定义、容易理解的文本标签体系。所以即使很难,但我们还是要做。”
分享过后,曹欢欢在现场解答了社会各界人士对算法的疑问,包括今日头条如何实现冷启动,广告和内容该怎样平衡,怎样准确地拓展用户兴趣图谱等切实的工程性问题。同时,听取接纳了大家对今日头条算法的意见和建议。
算法原则历来属于公司行业机密,极少有公司会对外公布。此次今日头条将算法透明化,并接受建言,属于行业首例。
今日头条方面表示,人工智能发展带来的挑战,是人类此前没有遭遇过的。当企业发展壮大时,有责任也有义务,与行业一道积极思考与研究新技术可能带来的机遇和风险。
如今,算法分发已经是包括搜索引擎、浏览器、资讯客户端甚至音乐软件在内的互联网产品的标配。今日头条这一举动,体现出一家平台对技术发展的责任感与诚意,这将对算法应用乃至整个互联网行业起到巨大的积极推动作用。