ai通话跟普通通话有什么区别(ai通话)

时间:2023-11-04 09:57:54 来源:网友上传 编辑:听梦的风尘女

手机上无处不在的AI,原来还藏有这么多秘密

尽管2023年才过完了一半,但来自AI领域的科技震撼却没有要结束的意思。回顾过往,AI从没像今天这般那样受人瞩目,似乎一夜之间,它就成了新的科技方向。

当然,眼下大家所谈及的AI,更多是以Chat GPT为代表的,一种基于人工智能技术驱动的自然语言处理工具。它能对话,能画图,能胜任各种工作;它懂逻辑,擅推理,甚至可以解读人的情绪和态度,如此种种,一步步填补了我们对真实AI的向往。

AI在拍照中的应用

其实聊到AI,大部分用户都不会陌生。我们每天手机不离手,而大家最开始接触AI应用,很多都是来自智能手机,其中最具代表的当属手机影像了。

在手机拍照过程,AI的作用称得上立竿见影。以小米13为例,当我们进入到相机界面,在下拉菜单项中,会有一个“AI相机”字样的选项。

开启AI功能后,我们会发现照片的色彩更明艳,饱和度更高,亮度也有所变化。有了这个功能,当你按下快门的那一刻,手机就会根据此时此刻的拍摄场景自动计算出最优方案,从而直接“P”出一张成片,省去了后期的步骤。

如果只是做到这一点,显然是不够的。随着智能手机AI能力的变化,在手机影像上,有AI参与的场景可以说是越来越深入,越来越频繁。

其中,夜景就是一个十分典型的场景。众所周知,CMOS的面积越大,进光量就越多,夜景照片成像质量自然就越好。但受限于机身的尺寸,手机内部很难塞下更大尺寸的传感器和光学镜头,光线越复杂,图像就容易产生噪点,看上去很模糊,手机拍夜景就会显得愈发力不从心。

但事实上,我们发现手机拍摄夜景其实是很能打的,甚至不输一些专业设备。为什么会这样呢?答案一目了然,自然还是与AI有关。

有了AI参与之后,手机拍摄的夜景照片就不再是单次曝光所得,而是连续拍摄多张不同参数下的照片,然后进行堆栈,进而合并成一张样张。这个过程还是比较复杂的,但利用AI可以快速找出样张中的特征点进行校准,再将多帧画面进行合成,有效去除噪点以及提升画面细节。

除了AI模式、夜景模式等基本应用外,随着AI能力的提升,也衍生出了万物追焦、疾速抓拍、魔法换天、背景虚化等进阶应用,大大丰富了手机相机的玩法,提升了拍摄体验。

万物追焦

就比如万物追焦,稳定精准智能可持续地追焦能力特别适合拍摄运动中的物体,如果家中有活泼好动的小孩子或者宠物,这个功能简直不要太好用。

魔法换天

还有魔法换天,你可以给相册中的照片编辑各式各样的天空效果,拍不出星轨没关系,可以后期一键生成,拍不到圆月也没关系,一键生成一个就完事了,甚至还能一键加入闪电、落日、极光、银河……不仅玩法新颖,看上去也是毫无违和感。

AI在日常生活中的应用

那么除了在拍照时,在日常使用时,又有哪些场景会用到AI呢?

其实还真不少,就比如在小米手机中,有一个很有意思的AI应用,可以说是我自己的最爱之一,它就是AI通话。

当有电话打进来时,我们无法接听,但又不想错过,或者总被营销电话骚扰不胜其烦,遇到这种情况,“小爱通话”就可以帮助我们很好完成“接听”工作。

对于MIUI用户来说,大家对小爱同学并不陌生,但应该很少有人知道它还有这种用途。简单来说,这就是一个基于AI技术的自动通话功能,接听后,小爱会识别对方所说的内容,用AI语音进行回复,在通话结束后,还会把对话过程通过文本形式记录下来,方便我们后期查看。

当大家追剧时,如果看到自己很喜欢的英剧美剧,却发现没有翻译字幕,肯定就要遗憾错过了。

同样在小米手机中,用户可以开启“小爱翻译”,找到“实时字幕”功能,这样在观看视频就会实时生成双语字幕。

实时翻译

从实际体验来看,它的翻译速度和准确性都很高,基本不影响理解。而且不仅仅追剧,在线直播、视频会议等场景都有不错的表现,可以说是AI在实际用机过程中颇具代表性的一个应用场景。

其实AI在手机中的使用场景还有很多,比如AI辅助信号增强,通过AI侦测用户手部使用习惯,可以更准确地侦测使用场景,从而实现更低的通话掉线率、更快的数据传输速率、更广的网络覆盖和更长电池续航;还有智能语音助手、照片分类整理、AI视频剪辑、面部解锁等等,满足了用户用机过程中的各种需求。

手机上AI的来自哪?

不过,AI这么强大实用,但它也不是凭空而来的。我们前面谈到的一系列AI用例都来自小米13,那么小米13的AI能力又来自哪里呢?

这就要说到它所搭载的第二代骁龙8移动平台了,第二代骁龙8移动平台搭载了一颗专门面向AI计算的Hexagon处理器,和以往不同,这次高通不但为Hexagon处理器设计了独立的供电系统,它的架构也有所变化,使其能够更好支持Transformer网络在终端侧的推理能力。

大家还记得小米13上的实时字幕功能吗,它之所以能够在本地呈现出快速准确的翻译效果。也正是凭借Hexagon处理器硬件性能的提升,使得第二代骁龙8移动平台成为了业内最先达到INT4精度的移动平台,与INT8精度相比,INT4带来的是90%的AI推理性能提升以及60%的能效提升,这使得第二代骁龙8,在自然语言处理用例下,能够实现4.35倍的AI性能提升。

除了Hexagon处理器外,在第二代骁龙8移动平台中,传感器中枢能力同样得到加强,实现AI性能的翻倍。一般来说,传感器中枢主要承担一些低功耗轻负载的任务,如大家熟悉的语音助手、视觉唤醒和图片分类之类的。

而在第二代骁龙8中,厂商能够围绕传感器中枢打造更为丰富的应用场景,比如息屏状态下也能快速扫二维码,或者实时监测是不是有陌生人正在偷窥你的手机屏幕,并及时关闭消息通知等等。

在影像方面,第二代骁龙8移动平台在Hexagon处理器和ISP之间,增加了一个名为“Hexagon直连”的物理连接,打造了移动行业首创的“认知ISP”,并带来了“实时语义分割”技术。

“语义分割”可以对画面中不同区域、不同元素进行单独的渲染处理,比如区分拍摄主体和不同的背景,或者在人像拍摄中,对被拍摄者的皮肤和五官进行单独修饰,它的处理过程是实时的,而且速度非常快,用户按下快门后,就能立马得到想要的照片,不用等待。

最后:

AI作为近年来最火热的一个领域,吸引了包括高通在内的许许多多科技公司的关注。如今,高通在AI领域已经走在了行业的最前沿,以骁龙移动平台为代表的一系列产品正不断刷新着移动端AI算力的新纪录,并且除了智能手机外,高通在XR、汽车、PC、物联网等领域同样有着广泛的布局,可以预见,终端侧AI即将迎来新一轮的巨大变革,直至彻底改变用户的使用体验。

值得一提的是,高通在6月16日正式发布了《混合AI是AI的未来》,明确表示在云端和终端进行分布式处理的混合AI才是AI的未来。另外,高通也谈到随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增长,前景可以说是十分光明。

总的来说,无论从实际体验上,还是中所阐述的,高通在终端侧AI方面确实有很大优势,而且要知道,全世界搭载骁龙和高通平台的已上市用户终端有几十亿台,每年还有数亿终端产品涌入。也正是得益于高通AI技术的支持,今天的手机、汽车、XR等等智能设备已经表现得非比寻常,假以时日,随着终端AI能力不断提升,打造一个触手可及的AI世界,似乎也没那么遥远。

小米被低估的“AI通话”,治好了我的精神内耗

本文素材来自于网络,若与实际情况不相符或存在侵权行为,请联系删除。

在我们日常的生活中,骚扰电话和推销电话似乎已经成为了家常便饭。这一情况主要源于国内互联网服务普遍要求手机号注册,导致我们的个人信息容易泄露。为了应对这一问题,国内手机制造商普遍内置了“拦截骚扰电话”的功能,它们依靠大数据分析,自动屏蔽一些明显恶意的陌生号码。

然而,我们普通用户仍然只能被动地抵御骚扰,而无法主动出击。若你是苹果用户,情况会更加糟糕,因为苹果一直未为中国用户提供骚扰拦截功能,只能手动一个个拉黑。

是否有一种方法可以改变这一局面呢?或者说,是否存在一种更好的方法来应对骚扰电话,而不只是简单地拉黑和屏蔽呢?或许答案就是采用“反向骚扰”。

这里所指的就是MIUI系统内置的“小爱通话”功能,它是以小爱同学的AI技术为基础,专门用于“帮助用户接听电话”和“自动接听骚扰电话”的AI自动通话功能。

开启这一功能非常简单,只需打开电话应用,点击左下角的“设置”按钮,然后点击“小爱通话”,再选择“自动接听”,并在下方勾选需要让AI自动接听的分类。例如,你可以设置只接听外卖、快递、打车、招聘和客服的电话,而屏蔽其他类型的骚扰电话。

一旦设置完成,当你接到骚扰电话时,小爱将自动接听并识别对方的内容,用AI语音进行回复。同时,通话内容也会以文字形式记录,方便日后查看,以免错过重要信息。

我进行了一次简单的实测,使用两部手机互相通话,结果令人满意。例如,当外卖送餐时,小爱会通知对方将食物放在门口;当快递到达时,小爱会提示对方将包裹放入快递柜。通话结束后,聊天记录会弹出提醒,这有助于防止骚扰,同时也不会错过重要信息。

然而,小爱通话也存在一些缺点。首先,AI的机器声音相对明显,只需与它聊上两三句话,就能辨别出它是个假人。其次,在自动接听时,通话界面不能默认挂到后台,除非你有特殊用途,否则可能不如直接屏蔽来得方便。最后,AI只能理解相对简单的信息,难以进行复杂的对话。

然而,小爱通话具有一些有趣的功能,例如自定义声音,你可以录制自己的开场白,提醒对方接下来会与一个语音助手通话。此外,你还可以切换不同的预设音色,甚至让AI学习你的原声,从而模拟出“本人的音色”。

如果小爱通话的AI技术得以进一步发展,能够处理更复杂的信息交流,并使声音更加自然,那么它将成为骚扰电话的“克星”。有时,我会利用这一功能来改善自己的心情,成功地治愈了内心的烦躁情绪。你是否体验过MIUI的这一功能?欢迎分享你的看法和讨论。

总结:

总的来说,国内手机制造商的拦截骚扰电话功能为用户提供了一种有效的抵御骚扰的方式。而MIUI系统内置的“小爱通话”功能则更进一步,通过AI技术的运用,使用户能够更主动地与骚扰电话进行互动,而不仅仅是被动地屏蔽。虽然存在一些缺点,但随着技术的不断进步,我们可以期待这类功能的不断改进,成为更好的骚扰电话应对工具。因此,对于那些经常受到骚扰电话困扰的人来说,这些功能无疑是一个可喜的利好消息。同时,我们也可以期待未来的技术发展,将更多智能化的功能带入我们的生活,提高我们的生活质量。

以上内容资料均来源于网络,本文作者无意针对,影射任何现实国家,政体,组织,种族,个人。相关数据,理论考证于网络资料,以上内容并不代表本文作者赞同文章中的律法,规则,观点,行为以及对相关资料的真实性负责。本文作者就以上或相关所产生的任何问题概不负责,亦不承担任何直接与间接的法律责任。由于平台规则,只有当您跟我有更多互动的时候,才会被认定为铁粉。如果您喜欢我的文章,可以点个“关注”,成为铁粉后能第一时间收到文章推送。本文仅在今日头条首发,请勿搬运。

你还在跟GPT打字交流?有人已经开始和AI视频通话了

当大伙还在想着法子,用 AI 摸鱼的时候,有人已经直接和 AI 视频聊上了。这不,在不久前,一款名叫 Call Annie 的 AI 视频聊天应用,在 App Store上线了。

应用的功能说起来也简单,相当于把 ChatGPT 给视频化了,视频化后的形象是一个名叫Annie的30岁女性,说是无论当老师答疑解惑,还是充当导游,甚至扮演虚拟伴侣,Annie都能胜任。

而该应用一上线,立马吸引了不少海外网友们的关注,相关的视频在推特上的播放量直接过了百万。

反正从网友们录制的视频来看,画面中的 Annie 对答如流,还真挺像那么回事儿。有意思的是,据知情人表示,这一金发美女的形象还是用Midjourney生成的,可以说是纯AI打造。

所以世超也赶忙下载了一个,体验一波和 AI 打视频电话的感觉。

在这儿提个醒,目前这玩意儿目前仅适用于IOS16,而且需要iPhone 12 或更高版本才能跟 Annie 视频。

打开应用,Annie那张黄金分割比例的欧美大脸就怼在屏幕上,不需要注册,按下“Call Annie”就可以直接开始视频通话了。

点头、眨眼睛、微笑、挑眉、上下打量,表情看起来丰富自然是我对Annie的第一印象,不过那张过于精致的脸还是时不时提醒我,对面是一个AI而非人类。

为了测试Annie的语言系统,世超打算跟她好好唠一唠,既然那么多外国网友的问题她都能对答如流,那咱们就反向操作一把,先来考考她的中文怎么样。

世超:“你叫什么名字”Annie:“@#¥%……&”没开玩笑,她说了一大堆听不懂的外星语之后,我甚至开始怀疑我的母语究竟是不是普通话。

直到我把字幕打开...破案了,我的母语是无语。

如果对着字幕听她讲的话,依稀能够辨认出来了确实有几个字是中文,如果你忽略掉他们之间的拼音在打架的话。。。

有一说一,她的中文不是一般的烂。而且在每个问题之后,Annie大概需要反应5-8s的时间才能给出答案,跟实时的视频还是有一定区别。

这让世超不得不当面吐槽了两句她的中文水平,没想到她认错的速度还是挺快的。

这才是测试的第一关,Annie就先在中文上扑街了。那既然中文不行,英文总可以吧?

我假设了一个在机场值机时的场景,让Annie陪我进行简单的英文对话交流,她不仅能够记住我几分钟前提的需求,而且在我不说话的时候还能主动出声提醒。

emmm,Annie果然还是更适合外国宝宝体质的AI呢。碍于语言系统的限制,我没有再继续为难她,如果哪位高手会七国语言的,可以试一试。

接着,世超又拿出了测试AI的经典保留项目:数学。“How many feet do a rabbit and two chickens have?(一只兔子和两只鸡一共有多少只脚?)”这问题够简单的吧,堪称鸡兔同笼问题终极无敌简化版,但没想到还是被打脸了。

一句“a rabbit has two feet”把世超雷得不行,说好的基于ChatGPT驱动呢?

一时间不知道该说她没有常识,还是该说她计算能力不行。。。于是我又把同样的问题丢给了ChatGPT,它的答案就正常多了。

ChatGPT:终究还是错付了。为了看看究竟是Annie偶尔抽风,还是真不行,世超又问了完整版的鸡兔同笼问题。

“ If Chicken and rabbit in the same cage, with a total of 30 heads and 88 feet. How many chickens and rabbits are there in each cage?(假设鸡兔同笼,共有30个头,88只脚。求笼中鸡兔各有多少只?) ”

这次兔子终于有四只腿了,而且她还把具体的方程式都给我列出来了。

测试下来,感觉Annie有一种既聪明又傻的感觉,所以我持怀疑态度地问了她所有答案的数据来源。

好家伙,除了ChatGPT以外,她还有不少别的知识数据库,而这是否是导致回答出现bug的原因还不得而知。

最后,世超又测试了Annie的实时联网情况,毕竟一个合格的虚拟伴侣怎么能不在网上冲浪的第一线呢?!

于是我问Annie “ Who is the monarch of England (现在的英国君主是谁)? ”“The monarch of England is Queen Elizabeth II 。”

那前几天刚登上国王宝座的查尔斯又是谁呢。。。这不明摆着没联网嘛。为了进一步确认,世超又象征性地问了问Annie关于明天的天气情况。手机上明明显示杭州第二天有雷暴,但Annie还是坚持告诉我,第二天是一个“beautiful day”。

一脸懵b的我又试探性地问了问Annie明天是周几。Annie:“Thursday(周四)”她的回答让今天刚过完疯狂星期四的我陷入了沉思。。。我的评价是,不如siri。

Annie没有联网已经实锤了,而且世超后面问她知不知道GPT-4,她告诉我OpenAI最新发布的大模型还是GPT-3。。。总结一下,Annie其实就是给ChatGPT套了张皮,本质上还是一个由AI大模型驱动的数字人。

虽说目前总体体验有些拉胯,但是世超还是想说,以 Annie Call 为代表的数字人技术,在未来还是有支棱起来的潜力的。

毕竟现在,数字人早已经进入千行百业了,随机点开一个卖货的直播间,或是去博物馆逛一逛,都有可能看到数字人的身影,“小冰”在抖音上现在都已经有124万的粉丝了。

而包括商汤科技、腾讯在内的公司,也在不断推出数字人相关的新技术,据说只需要几分钟,就能照着真人的模样和声音,整出个数字人。

当然了,除了最为火爆的直播带货以外,像客服这种重复又枯燥的岗位,也存在大量的数字人应用需求,等到数字人客服大规模“持证上岗”的那天,隔着屏幕可就真假难辨咯。

一个猜测不一定对,有没有一种可能,下次的评论区回复是数字人在后台操作的呢。

和他们聊了聊,我才知道华为为什么要“吃力不讨好”

31 岁的梁智敏,是一位程序员。

自学了UI 和前端开发,是一名 Vue 的熟手,更是一家互联网公司的合伙人。

在这些看起来挺平常的平常标签之外,他还是一名听障人士。

从五岁开始,他的耳朵渐渐开始听不见了。

而且因为植入人工耳蜗和助听器的时间比较晚,目前听力依旧几乎为0 。

据他说,人工耳蜗在非常安静的环境下,可以正常工作。

但是只要环境音复杂了,耳朵里听到的就全都是嗡嗡的电子音,没有办法分辨有效对话。

所以这么些年,他都是用手机上的字幕软件来获取信息的。

一开始,他发现这个功能还是在塞班年代。

那个时候,诺基亚的系统上其实并没有这样的功能,但是搜狗输入法里已经有了 “ 语音输入 ” 功能,他利用这个每次只能听一句话的功能,撑了好几年。

后面随着换了智能机,性能越来越强了,专门的 AI 字幕无障碍服务开始出现,他日常与别人的交流才开始热络起来。

现在的他,因为担心遗漏错过别人找他的消息,会在工作的桌面上额外放一台手机,通过识别出来的字幕来及时和他人交流。

智敏也很高兴地跟我科普了很久这些年 AI 字幕 App 的发展:他说,一开始其实也还是听障用户之间的自救。

当时有一个会技术的听障朋友,开发了一款名叫音书的App 。

但是因为里面的声音引擎用了讯飞的付费 API ,所以需要定期充钱才能用。

后来讯飞亲自下场,并且推出了听障免费认证,他们听障用户就不用再为实时字幕交钱了。

但是因为讯飞是第三方 App ,拿不到系统底层的权限,所以这时候的字幕 App 只能显示外界麦克风收到的声音。

手机里面,像是视频、收音机以及打电话时候的声音都是没有的。

这一块拼图,直到手机厂商自己开始做内建服务,才算最后凑齐。

我了解到智敏的这些故事,起源于华为开发者大会上一个几乎从来没有被报道过的活动。

HDC 湖畔对谈。

简单来说,就是华为邀请了真正的视障、听障、肢体残障和老年朋友们,与华为终端 BG 的首席运营官何刚以及无障碍相关业务的负责人们,来到松山湖三丫坡的草坪围流。

聊一聊他们现阶段在使用手机等数码产品的时候,还有哪些问题。

以及通过华为的努力,能帮助他们再做些什么。

这次的活动持续了一整天,我现在已经参加完回来了,简单说下我的想法吧:

我觉得华为是真的不行。

他们去年就应该喊我来这个活动好吧!

有些东西确实是不交流不知道,过去我们提到无障碍,第一时间想到的就是视障、听障这些,然后系统里做点儿对应的辅助增强的工具就行了对吧?

但这样其实是远远不够覆盖“ 无障碍 ” 这个概念的,不和真正用户交流,就没法真正解决他们的痛点。

我跟华为小伙伴聊的时候,他们就分享了不少他们从用户反馈中,做出的优化。

比如——如何保护视障用户的隐私?

以往手机开启视障读屏模式之后,屏幕亮度是不变的。

HarmonyOS 4 当中这次就对这个功能做了调整,读屏的时候,屏幕亮度会降至极低——既保护隐私,又省电。

而在此之前,手机无障碍模式播报数字密码的时候,也已经能很聪明的把输入的密码播报成 “ 点 ” 了。

又比如说,听障用户们怎么接打电话?肯定会有小伙伴说了,AI 电话.

没错,这个功能华为、小米、谷歌都有。

但是华为无障碍团队在交流的过程中,收到了听障用户的反馈说,AI 通话的音色和现在那种电话推销机器人的很像。

导致有时候他们拨出去电话还没说完一句,对方就给挂了。

因为有了这个反馈,华为才在这次 HarmonyOS 4 的小艺通话里额外加入了几个新的更自然的音色选项。

听障朋友们以后给别人拨出电话被误挂的概率应该会低很多。

甚至这个功能还被琢磨出了点其他奇妙用法。

听华为小伙伴说,他有独居的女同事也开启了这个功能,然后就可以用男声的音色去接外卖和快递的电话了

除了听障方面的钻研以外,视障这边也是如此。

去年我们测试过的无障碍视觉识别,一开始其实也不是冲着智能问答来的。

而是为了能帮用户更好的拍照。。。

他们也有朋友,也需要分享快乐,照片当然是最直观的方式了呀。

但是他们自己看不清,这时候如果相机能告诉他们,怎么把相机给挪到合适的位置就好了。

结果做着做着整到一半,华为突然发现,这个功能,诶?好像还可以做点儿别的:

比如帮视障用户确认衣柜里衣服的颜色,避免穿错了。

又或者能在一个陌生的空间里找到门的大概位置,在志愿者没到位的情况下应应急。

所以才有的后面的更丰富的播报功能,以及一来一回的智能问答。

大家不要觉得这个需求很不现实。

一开始很多小伙伴评论道:“ 视障人士怎么能举起手机对准目标呢? ”

在评论区里说华为这个功能堪比太阳能手电筒、虚空索敌。

直到一些真的视障朋友也刷到了视频,在评论区现身说法之后大家才知道。

其实大部分视障朋友其实也还是有色块和空间感知的能力在的,他们能看到,只是看不清。

而这次交流之后我更是知道了,这个功能甚至就是视障朋友们给华为提出来的,而不是反过来。

很多时候,企业责任就是在这些小细节上体现的.

让用户反向提出需求,一定才是无障碍功能使用体验提升的最佳路径。

不过交流之后我发现,华为的小伙伴他们自己内部对现在的成果还是不太满意的。

尽管一年过去了,现在还是只有苹果、华为有这项技术。

但华为的小伙伴还是觉得可以继续打磨一下问答的部分,支持上更自然和复杂的提问,那就就又能帮助到比现在更多的人了。

假如真能做成了,到时候他们就真的没竞品了。

确实。。。是一家自己卷自己的企业哈。

回到智敏身上,在和他交流的时候,我听到他说他从P8 开始一路用到了现在的Mate 40 。

就挺好奇的问了他一下,作为一个听障人士,为什么一直选的华为?

结果没想到理由非常之朴素。

因为华为信号好。

草率了,曾经我一直以为手机上的 AI 字幕是离线运行的。

但其实现在除了小部分旗舰机有 NPU 运算的方案,绝大多数手机的 AI 字幕还是只能靠联网识别。

那这个时候识别的效果稳不稳,完全就是看信号稳不稳了。

智敏说他之前用其他手机的时候,有时候明明还有那么一两格信号,但是字幕就卡住了,只能干着急。

但是换了华为之后,他在电梯和地库里面,几乎没有遇到过问题。就导致他对华为的好感特别高。

而且还有一点很小的细节,智敏说华为甚至把这个系统级AI 字幕给移植到了电脑上,华为笔记本里面的AI 字幕也自带这个功能,这是他之前用其他电脑的时候没有遇到过的。

他平常在网上看的开发教程和资料,很多是不自带字幕的,华为电脑里面这个很小的细节就能帮到他很多。

我和智敏那天下午零零总总聊了差不多一个半小时,他说他对目前的技术已经很满意了——华为信号稳、现在流量价格也不贵了。

尤其这次HarmonyOS 4 里面要全面实现纯离线的识别,那以后更是一点儿流量都不需要了。

接下来假如听障相关的辅助功能还想有提升,他觉得应该是续航和情绪识别两个方面。

第一个好理解,开着字幕识别肯定费电嘛,他说他用手机,得一天三充,包里最极限的时候,放过 3 台手机、8 个充电宝。

这次因为活动的天数比较短,他只带了两个手机、一个充电宝,就没太好意思给我 “ 展示军火 ” 。

这个我觉得随着芯片制造水平的发展,以后手机的续航时间肯定越来越长。

第二个,我一开始没太明白,后来他跟我说,其实他几年前谈过一个女朋友,一开始两个人感情很好,但是后面渐渐有点儿坚持不下去了。

因为女生不想让智敏一辈子靠着冰冷的 AI 字幕跟她谈恋爱。有了这次的经历之后他就在想,要是 AI 字幕也能够呈现语气就好了。

假如放在以前,我可能会觉得这第二个设想略微有些遥远。

但是随着今年爆发的 AI 大模型、HarmonyOS 4 里集成上的盘古版小艺。

诶,好像也不是那么远的了感觉?

说不定到时候先让功能落地的,还是华为。

今年的 HDC 上,华为提了一个概念。

科技世界不是冰冷的0 和 1 ,而更应该是贴近人类体温的 37 ℃。

但其实在说出这个 slogan 这之前,华为已经投身无障碍技术六年的时间了。

从一开始反向适配那些不规范无障碍开发流程的 App,到联合无障碍硬件的厂商,支持助听器设备接入到鸿蒙生态当中,以及这两年利用AI 赋能,对视障、听障相关的无障碍体验做更全面的优化提升。

哦对了,还有线下讲座的开设——适老化设计也是华为无障碍团队的一项日常工作。

听华为的小伙伴说,他们光是今年上半年,就通过线验店进入老龄化社区,开设了 3000 多场使用手机常用功能的系列课程。

即使是在华为内部最难的一段时间里,这项业务以及上面具体技术的探索与开发,都没有因外部挑战而停止过。

而这其实才是真正的无障碍,这其中的概念,不是和身体功能绑定的,而是精神层面的关怀——让每一个人都不在数字世界的体验当中掉队。

这一点,我觉得才是一家企业践行责任的体现。

声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送至邮件举报,一经查实,本站将立刻删除。转载务必注明出处:http://www.hixs.net/article/20231104/1696261072118802.html