首        页 组织机构 文件通知 新闻聚焦 课改实验 课题管理 科研成果 校本教研 高中课改
高考点播 中考辅导 课程研究 教学指导 双语教学 学前教育 教学艺术 教法探讨 教学资源
专家讲座 论文推荐 领导风采 教研精英 校园展播 校长风云 名师介绍 班级管理 教育学会
心理咨询 家长学校 教学杂志 征订通知 教育论坛 综合实践 德育研究 优质课程 教学课件
  您的位置:首页 -> 视频行业爆发前夜,一篇技术论文透露了哪些行
视频行业爆发前夜,一篇技术论文透露了哪些行 

添加日期:2017-08-23 00:18  来源:www.jksedu.com  点击次数:

视频行业爆发前夜,一篇技术论文透露了哪些行

放眼全球,如果用一句话来形容当下消费互联网的大势,「视频吃掉世界」恐怕是再合适不过的话了。

7 月,在 Facebook 历史性地突破 20 亿月活用户后,扎克伯格告诉分析师们,随着用户在 FB 上视频内容消费的大幅增长,FB 会进一步研发底层的视频技术,保证用户在视频消费、视频生产(上传)上的优秀体验。

中国地区用户对于视频内容的需求也十分旺盛。在 QuestMobile 发布的《移动互联网2017春季报告》中,包括在线视频、网络直播、短视频等行业,移动视频的用户月度总规模首次突破10亿,同比增长36.5%。

视频行业爆发前夜,一篇技术论文透露了哪些行

更进一步的佐证来自 CNNIC 的第40次《中国互联网络发展状况统计报告》,截至 2017 年6月,中国网络视频用户规模达5.65亿,较2016年底增加2026万人,增长率为3.7%;网络视频用户使用率为75.2%。

视频行业爆发前夜,一篇技术论文透露了哪些行

在这样的背景下,不管是 BAT 这样的传统流量大户还是今日头条此等的流量新贵,都在不遗余力地押注视频。百度强化视频在 Feed 流中的地位、腾讯领投快手、阿里旗下土豆全面转型、今日头条旗下抖音准备出海......这些举措会让人产生一种视频时代即将全面到来的产业错觉。

诚然,如上文所言,「视频正在吃掉世界」,但就像过往任何产业爆发点类似,在商业应用落地的同时,底层技术进步的重要性不言而喻。以视频行业的现状来看,一方面是产业生态的疯狂,另一方面则是在一些底层技术上的瓶颈,比如可用于视频动作分析的技术并没有得到有效的利用,这也让围绕视频内容的分类检索、标签推荐变得非常困难,不仅影响到了视频的展示效果,同时也制约了用户的视频消费体验,而这个行业痛点,不是融资或推广就能解决,它必须依靠技术上的突破。

类似的困难和挑战还有不少,这也使得最近一系列围绕视频技术学术会议或竞赛成为行业关注的焦点。比如在今年的 ActivityNet Challenge 上,几篇围绕视频技术新突破的获奖论文就为视频行业未来发展路径提供了灵感。

论文透露出的行业机会

ActivityNet Challenge是目前视频动作分析领域影响力最大的竞赛,包括 MSRA、CUHK、CMU、UTS 等众多高校和科研机构都会积极参与到比赛里。在今年的比赛里,有两个新增的项目:「Kinetics」和「ActivityNet Captioning」两个数据集。其中「Kinetics」是一项视频行为分类比赛,有400个视频动作类别,大约20万训练语料,可谓 ActivityNet 最具看点的一项任务。

根据 ActivityNet 最新公布的结果,今年「Kinetics 视频行为分类比赛」冠军被来自百度的 Genome 团队获得,香港中文大学和来自德国的创业公司 TwentyBN 分列二三位。

按照惯例,ActivityNet 各项任务的冠军都有机会在 CVPR 上展示自己的论文,因此,我们也有机会进一步了解这支来自百度的技术团队如何思考新一代技术,尤其是基于深度学习的人工智能之于视频行业的意义。

论文网址在https://arxiv.org/abs/1708.03805,有时间的话建议下载下来细细研读,没有时间精力的话,可以直接看下面我们的解读:

首先,视频分类技术的根本,是要让视频成为像文本、图片一样的结构化数据。过去很长一段时间里,互联网上都是文本、图像数据,但最近几年随着移动网络的普及以及智能手机性能的提升,视频内容已然「霸占」了移动互联网,然而对于很多开发者或视频服务商来说,视频内容是一种典型的非结构化数据,它无法像文本、图像那样被自动检索和有效利用,需要大量人力成本进行手动查看、加标签以及审核,效率低下。

在百度 Genome 团队的这篇论文里,提出了一整套视频分类的解决思路,通过对视频内容的智能分析和提取,它能够自动提取视频中的语音、文字、任务、物体等元素,从而自动输出这些视频的泛标签。这些提取的「泛标签」,事实上也让视频内容变成了半结构化的数据——它可以被简单分类和检索,对开发者或视频服务商来说,已经节约了前期人工处理的时间,从而大大提升了效率。

其次,视频分类技术的应用场景非常广泛,不仅会解决视频服务商的痛点,还能在提升用户体验上发挥作用。

举个简单的例子,基于深度学习的视频分类技术,可以让视频对比检索变得非常简单。很多用户常常会有一种需求,即能否通过一张静态图像来搜索某个视频,这与过往以文本搜索视频的技术完全不同,它需要在静态图像上提取有效信息,并将这些信息与已经半结构化的视频库进行对比,从而准确并快速找到最符合条件的视频。

  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页
  • 上一篇:山大被取消硕导资格教授获国家社科基金项目立 下一篇:秋高气爽去爬山,国内秋季登山游推荐

       织梦CMS官方     DedeCMS维基手册     织梦技术论坛