微软认知服务(Microsoft Cognitive Services)于四月底向其用户发布了人脸识别API(Face API)、计算机视觉API(Computer Vision API)和内容审阅API(Content Moderator API)。
认知服务集合了多款API和服务,帮助开发人员在自己的应用程序中添加图像识别、语音、翻译和其他功能。这些API还可以帮助开发人员在他们的应用程序中添加人工智能和机器学习功能,而无需亲自动手开发这些功能。
人脸识别API可以帮助检测并识别人脸。微软可以鉴别两张图像是否属于同一个人(这对于需要使用人脸识别技术来鉴别司机身份的公司来说非常实用,比如Uber)。人脸识别API还可以根据视觉相似性将人分组。这一功能的用例之一就是将老年人和年轻人分在不同的类别中。如果一个人之前被标记过,人脸识别API也将在新的图像中再次识别他们。除此之外,人脸识别API还能检测人脸部的表情。
计算机视觉API可以根据内容对不同的图片打上标签。比如说,下图能得到“水”、“运动”、“游泳”和“游泳池”这样的标签。该API还能检测到这张图像不包含种族歧视和成人级内容。
计算机视觉API包括两个特定领域模型,帮助你识别地标和名人。
计算机视觉服务也可以用一句话描述一张图像。举例来说,会有这样的描述:“一个人坐在一张长凳上”。微软还加入了手写检测功能,可以帮助检测、分段并读取手写的文字。他们展示了几个计算机视觉API将便利贴和备忘录内容转换为计算机可读文本的用例。
内容审阅API可以帮助用户筛选应用程序中输入的文字和图像。它可以识别可能令人不悦的或不需要的图像,并查找图像中具有攻击性的文字。现在已实现检测超过100种语言的手写文字中令人不悦的内容。内容审阅API还能帮助搜索个人可识别信息(PII)。视频审核API可以帮助检测视频中的成人级内容,但该功能目前仅供预览。
2015年4月这些API就作为alpha版本发布。在通用版本发布阶段的过程中还加入了许多功能。这些API是分布于视觉、语言、语音、搜索和知识领域的25种认知服务API的一部分。用户可以免费使用这些API的一些数据内容。通过访问在线演示页面,你可以上传自己的图像试用API提供的功能,获取相应的数据。每月需要识别超过30000张图像的用户需要支付约每1000张图像0.55欧元/0.65美元到1.27欧元/1.50美元的费用。
查看英文原文:Microsoft Releases APIs for Face Recognition, Computer Vision, and Content Moderation