阿里云智能识别系统功能和优势

阿里云智能识别基于阿里云的最新研究成果,为您提供视频内容的全方位识别,支持识别视频内的人物、语音、文字、物体以及帧标签,对视频进行多维度结构化分析。

阿里云智能识别系统功能

1、人脸识别

基于深度学习方案,帮助客户快速识别视频中的人脸信息并快速定位出视频中的人物所在帧画面,以及人脸所在区域。客户可自定义人物库或调用视频 AI 公共人物库进行人脸识别。

2、语音识别

基于深度学习方案,帮助客户快速识别视频中的声音并转化成文字,支持客户自定义关键词且定位出关键词所在视频的时间点。

3、文字识别

帮助客户识别视频中出现的文字信息,可用于视频内自定义关键词的提取,也支持竖版文字的识别。

4、帧标签识别

基于深度学习方案,支持根据客户自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置,帧标签涵盖人物、风景、人造物、建筑、动植物、食物等9个大类,包含日常生活的各个信息维度,并且支持在标签体系基础上使用自定义标签,具备迁移学习能力,只需提供原始用户数据便可定制分类器,满足不同类型的用户需求,使标签分类更具灵活性。

5、物体识别(目标检测)

帮助客户识别视频中的物体或 LOGO,可定位到物体所在视频画面中的位置,目前可基于客户需求定制训练,现支持百种 LOGO 识别。

6、片头片尾识别

根据视频画面特征、文字、语音等信息自动识别定位电影/电视剧片头片尾时间点。

阿里云智能识别系统优势

1、引擎整合

基于阿里领先的 AI 技术,并整合阿里实验室的最新研究成果,将其应用到视频场景中,为用户提供一站式智能识别服务。


2、海量标签

百万人脸数据库和海量视频标签,涵盖人物、风景、食物、建筑、动植物、场景等9大类,包含日常生活的各个信息维度,满足视频内容全方位标签化。


3、简单易用

对外提供公有私有一体化、直播点播统一化的标准 REST API 接口,可与云点播服务、COS 存储、第三方存储系统快速打通,支持便捷接入、自主调度切换。


4、倍速可控

基于分布式视频处理算法,对于不同客户可以满足不同倍速、不同并发、不同识别粒度的处理要求,自适应满足用户处理效率和成本的平衡,提升性价比。


5、高可定制

接入简单、成熟稳定、高效灵活的 API 接口,为用户量身定制视频智能服务私有化中台,帮助用户构建安全稳定、高效可靠、性价比高的视频云服务生态。


6、准确高效

海量的数据样本及丰富的特征数据分析模型,对视频每一帧进行画面、音频、文字多角度分析,从而提供准确、全面的音视频内容结构化识别能力。