详情

原文传递一种语音播报方法、装置和车辆

专利名称：	一种语音播报方法、装置和车辆
摘要：	本发明公开了一种语音播报方法、装置和车辆，其中方法包括获取车辆的语音播报需求指令，得到对应的待播报文本；根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态；根据所述情绪状态，确定用于表征语音的声学特征，所述声学特征至少包括频段范围；基于所述频段范围，控制对应的所述振动传感器工作，以播报所述待播报文本。本发明实施例提供的语音播报方法、装置和车辆，通过在座椅靠背上设置若干振动传感器，对用户的情绪状态进行智能分析，控制对应位置的振动传感器工作，优化了音频的表现形式，解决了现有的车辆语音播报单一的技术问题，提高了用户的用车体验。
专利类型：	发明专利
国家地区组织代码：	广东;44
申请人：	星河智联汽车科技有限公司
发明人：	李兆全;许为康;武子平;汪华锋;张盼盼;邓晨
专利状态：	有效
申请日期：	2022-10-31T00:00:00+0800
发布日期：	2023-01-24T00:00:00+0800
申请号：	CN202211353973.4
公开号：	CN115635912A
代理机构：	广州三环专利商标代理有限公司
代理人：	姚心怡
分类号：	B60Q9/00;B60N2/90;B60R16/023;G06F3/16;G06F40/237;G06F40/284;G06F18/22;G06V10/82;G06V40/16;G10L15/22;H04R23/00;B;G;H;B60;G06;G10;H04;B60Q;B60N;B60R;G06F;G06V;G10L;H04R;B60Q9;B60N2;B60R16;G06F3;G06F40;G06F18;G06V10;G06V40;G10L15;H04R23;B60Q9/00;B60N2/90;B60R16/023;G06F3/16;G06F40/237;G06F40/284;G06F18/22;G06V10/82;G06V40/16;G10L15/22;H04R23/00
申请人地址：	510330 广东省广州市海珠区阅江中路832号保利发展广场2903—07
主权项：	1.一种语音播报方法，适用于座椅靠背上设有若干振动传感器的车辆中，其特征在于，包括：获取车辆的语音播报需求指令，得到对应的待播报文本；根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态；根据所述情绪状态，确定用于表征语音的声学特征，其中，所述声学特征至少包括频段范围；基于所述频段范围，控制对应的所述振动传感器工作，以播报所述待播报文本。 2.如权利要求1所述的语音播报方法，其特征在于，在所述获取车辆的语音播报需求指令，得到对应的待播报文本前，所述方法还包括：基于用户发布的语音指令，生成对应的语音播报需求指令；或，基于识别到的车辆控制信号，生成对应的语音播报需求指令；或，基于当前车辆的导航位置坐标，生成对应的语音播报需求指令；或，基于当前路况，生成对应的语音播报需求指令。 3.如权利要求1所述的语音播报方法，其特征在于，所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态，具体包括：控制车载摄像头获取用户的人脸图像；对所述人脸图像进行卷积神经网络分析，基于所述人脸图像中的人脸特征点的变化轨迹，确定对应的所述情绪状态。 4.如权利要求1所述的语音播报方法，其特征在于，所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态，具体还包括：对所述待播报文本进行文字分段截取；将各个截取段落输入至预设的敏感词库中，根据文字的匹配度，确定对应的所述情绪状态。 5.如权利要求1所述的语音播报方法，其特征在于，所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态，具体还包括：对所述位置坐标进行分析，得到当前车辆的场景，其中，所述场景至少包括拥堵路段场景和通畅路段场景；根据当前车辆的场景，确定对应的所述情绪状态。 6.如权利要求1所述的语音播报方法，其特征在于，所述声学特征还包括语速特征、韵律特征和停顿特征。 7.如权利要求1所述的语音播报方法，其特征在于，所述情绪状态至少包括高兴状态、悲伤状态、害怕状态、愤怒状态和无感情状态；所述愤怒状态对应的所述频段范围为20-8000Hz；所述无感情状态对应的所述频段范围为8000-10000Hz；所述害怕状态对应的所述频段范围为10000-12000Hz；所述悲伤状态对应的所述频段范围为12000-15000Hz；所述高兴状态对应的所述频段范围为15000-20000Hz。 8.如权利要求7所述的语音播报方法，其特征在于，所述基于所述频段范围，控制对应的所述振动传感器工作，以播报所述待播报文本，具体包括：若所述频段范围为20-8000Hz，则控制设置于座椅靠背中心位置的第一振动传感器工作，以播报所述待播报文本；若所述频段范围为8000-10000Hz，则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背顶部位置的第二振动传感器和设置于座椅靠背底部位置的第三振动传感器工作，以播报所述待播报文本；若所述频段范围为10000-12000Hz，则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作，以播报所述待播报文本；若所述频段范围为12000-15000Hz，则分别控制设置于座椅靠背顶部位置的第二振动传感器、设置于座椅靠背底部位置的第三振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作，以播报所述待播报文本；若所述频段范围为15000-20000Hz，则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背顶部位置的第二振动传感器、设置于座椅靠背底部位置的第三振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作，以播报所述待播报文本。 9.一种语音播报装置，适用于座椅靠背上设有若干振动传感器的车辆中，其特征在于，包括车载T-Box，所述车载T-Box被配置为：获取车辆的语音播报需求指令，得到对应的待播报文本；根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标，确定用户的情绪状态；根据所述情绪状态，确定用于表征语音的声学特征，其中，所述声学特征包括频段范围；基于所述频段范围，控制对应的所述振动传感器工作，以播报所述待播报文本。 10.一种车辆，其特征在于，所述车辆的座椅靠背上设有若干振动传感器；所述车辆被配置为实现如权利要求1～8任一项所述的语音播报方法，或所述车辆包括如权利要求9所述的语音播报装置。