【HarmonyOS NEXT】codelab汇总-AI
1、机器学习-场景化语音服务(ArkTS)
介绍:介绍了如何使用HarmonyOS提供的Speech Kit(场景化语音服务):Speech Kit(场景化语音服务)集成了语音类AI能力,包括朗读控件(TextReader)和AI字幕控件(AICaption)能力。其中,朗读控件可以在用户不方便或者无法查看屏幕文字的时候,为用户朗读新闻,提供资讯;AI字幕控件则能在用户不熟悉音频源语言或者静音的场景下,为用户提供字幕服务。
总结:通过此Codelab,可了解到以下知识点:
如何使用Harmony OS SDK完成一个基本Demo编写。
如何调用Harmony OS SDK中的Speech Kit。
详情地址:https://developer.huawei.com/consumer/cn/codelabsPortal/carddetails/tutorials_Next-SpeechKit
2、机器学习-基础视觉服务(ArkTS)
介绍:
-
通用文字识别服务旨在为开发者提供图像信息转换为字符信息的能力。通过拍照、扫描等光学输入方式,把各种票据、卡证、表格、报刊、书籍等印刷品文字转化为图像信息,再利用文字识别技术将图像信息转化为计算机等设备可以使用的字符信息,便于用户提取字符内容、屏幕坐标及外框。目前本服务支持识别的语言有:简体中文、英文、日文、韩文、繁体中文。
-
人脸检测功能通过对图片中的人脸进行识别、检测,返回高精度人脸矩形框坐标、人脸五官位置、人脸朝向、人脸置信度。可通过对人脸的定位,实现对人脸特定位置的美化修饰。广泛应用于各类人脸识别场景,如人脸解锁、人脸聚类、美颜等场景中。不支持同一用户启用多个线程。
-
人脸比对功能通过对两张各包含一个清晰人脸的图片,将两张人脸进行高精度比对,输出相似度值,进而判断两者是否为同一个人。
-
主体分割功能通过识别图片中的一个或多个显著性(图片面占比大于千分之五)主体,输出该显著性主体的边界框、前景图、掩码图等数据。
-
多目标识别功能通过识别图片中常见的目标对象,输出目标对象的信息。
-
骨骼点检测功能通过关键点描述人体骨骼信息
总结:通过此Codelab,可了解到以下知识点:
如何使用Harmony OS SDK完成一个基本Demo编写。
如何调用Harmony OS SDK 中的通用文字识别功能。
如何调用Harmony OS SDK中Core Vision Kit的人脸检测和人脸比对功能
如何调用Harmony OS SDK中Core Vision Kit的主体分割功能
如何调用Harmony OS SDK中Core Vision Kit的多目标识别和骨骼点检测功能
详情地址:https://developer.huawei.com/consumer/cn/codelabsPortal/carddetails/tutorials_Next-CoreVisionKit
3、机器学习-场景化视觉服务
介绍:Vision Kit(视觉服务)集成了视觉类AI能力,提供了人脸活体验证(interactiveLiveness)能力,便于用户与设备进行互动,验证用户为真实有效活体;提供了卡证识别能力,可以识别身份证、行驶证、驾驶证、护照、银行卡等证件,返回结构化数据信息。
总结:通过此Codelab,可了解到以下知识点:
如何使用Harmony OS SDK完成一个基本Demo编写。
如何调用Harmony OS SDK中的Vision Kit。
详情地址:https://developer.huawei.com/consumer/cn/codelabsPortal/carddetails/tutorials_Next-VisionKit
4、意图框架服务(ArkTS)
介绍:介绍了意图框架如何帮助开发者将应用和元服务内的业务功能,智能地分发到各系统入口。(以习惯推荐方案的歌曲续听推荐、事件推荐方案的还款待办事件提醒为例)
总结:通过此Codelab,可了解到以下知识点:
如何注册意图。
如何共享意图。
如何调用意图。
5、机器学习-基础语音服务(ArkTS)
介绍:Core Speech Kit(基础语音服务)集成了语音类基础AI能力,包括文本转语音(TextToSpeech)及语音识别(SpeechRecognizer)能力,便于用户与设备进行互动,实现将实时输入的语音与文本之间相互转换。
总结:通过此Codelab,可了解到以下知识点:
如何使用Harmony OS SDK完成一个基本Demo编写。
如何调用Harmony OS SDK中的Core Speech Kit。
详情地址:https://developer.huawei.com/consumer/cn/codelabsPortal/carddetails/tutorials_Next-CoreSpeechKit
6、计算平台-HiAI Foundation-图像分类(C++)
介绍:建立一个具备运行AI模型实现分类图片中物体功能的HarmonyOS应用程序。
相关知识:API11、图像分类、AI
总结:通过此Codelab,可了解到以下知识点:
如何在DevEco Studio上创建应用。
如何调用HiAI Foundation提供运行AI模型的图片分类服务API。
7、机器学习-自然语言理解服务(ArkTS)
介绍:
-
词性标注为分词结果中的每个单词标注一个正确的词性的程序,标注每个词是名词、动词、形容词或其他词性。以下简称本服务。本服务通过识别文本框内的文本,调用本服务,把用户输入的普通文本信息转换为一个结构体数组,每个结构体中包含使用Natural Language Kit分词之后的词语和词性。目前本服务支持的文本:简体中文、繁体中文、英文。限制为1000个字符。
-
实体抽取功能通过对用户输入的文本进行Natural Language Kit实体识别。将用户输入的普通文本依据Kit中的实体类别来进行分类,其中用户可以根据实体类别列表中的类别来进行选择。输出结果中包含实体的类别、实体在原文本中的位置、实体的原文本以及实体解析后的其他字段。实体字段内容可参考文档详情。
总结:通过此Codelab,可了解到以下知识点:
如何使用Harmony OS SDK完成一个基本Demo编写。
如何调用Harmony OS SDK中Natural Language Kit的词性标注和实体抽取功能。