AI语音  AI语音

AI语音

会议转写一体机T1

BC正面.png

实时长语音识别引擎

国产自主研发产品同等情况下优先考虑(提供软件著作权或专利证明)
1.私有化部署,纯内网环境使用,无需连接互联网;
2.实现对中文普通话连续语音的实时转写,支持中英文混合识别,并提供对已转写文字的后处理及字音同步对齐能力;

录音文件长语音识别引擎

国产自主研发产品同等情况下优先考虑(提供软件著作权或专利证明)
1.引擎离线部署,纯内网使用,实现对中文普通话、中英文混合音频进行语音识别文字;
2.音频转写效率可达1:6,即1小时音频时长需10分钟转写完成;

3.支持对音频文件中的说话人进行分离,支持算法自动区分、支持指定说话人数量区分,支持不少于8个说话人识别;

4.普通话中文录音转写准确率≥98%;(需提供具备CNAS认证或CMA认证的第三方检测机构出具的检测报告扫描件)

智能转写系统

1.实时会议速记:系统支持实时语音转写,利用电脑自带麦克风或者外接音频采集设备,均可将语音转写成文字,并且进行实时结果展示。
2.实时编辑:提供编辑页面,可以对转写的结果、翻译的结果进行实时修改编辑,包含增加、删除、修改、替换、查找、分段。

3.手动角色分离:支持快捷键输入发言人信息,在实时会议过程中按快捷键可以手动角色分离,同时也可以进行角色的添加、修改和删除;快捷键输入发言人数量,至少支持12个。

★4.实时会议过程中,通过登记过的声纹记录实时区分出说话人的身份,并在识别出的发言内容前自动添加上发言人姓名、发言时间戳信息。(需提供产品功能截图证明)

★5、在会议过程中、会议暂停或会议结束后,通过鼠标选中某一句或几句文本内容,截取文本内容对应的语音片段,注册到声纹库中,实现无感知的声纹注册;声纹具有可迁移、不稳定的特性,系统应支持多次补充登记持续优化声纹验证的准确性,至少支持保留近5次的声纹登记结果。(需提供产品功能截图证明)

6、至少支持声纹登记支持截取文本记录片段、上传历史会议记录中的音频和朗读指定文本这3种登记方式。(需提供产品功能截图证明)
7.关键词优化-文本优化:将人名、地名等专业术语添加到系统中,系统即可进行效果优化,有效提升专业术语识别效果;在添加热词过程中,支持用户选择只在本次会议中生效或保存到热词库中长期有效。(需提供产品功能截图证明)
8.敏感词屏蔽:针对不想展示的词汇,可添加到敏感词列表中,当系统检测到该词汇时则会自动采用*号进行屏蔽。
9.自动分段:系统至少提供3种自动分段方式:智能语义分段、句数、字数。
★10.AI精转:实时速记完成的会议记录,支持使用AI精转功能,结合全文语义进行优化,进一步提升识别准确率。(需提供产品功能截图证明)
★11边听边改:开始会议后,通过边听边改功能,系统自动回拨到设定的时间点,完整对照文本和音频进行边听边改;回拨时长支持0.5~600秒可配置。(需提供产品功能截图证明)
12.按句回听:双击文本,可实现音频按句回听。

13.音字对照:回听过程中,系统自动高亮显示当前播放音频对应的文本。
14.纪要模块:在系统自动记录会议过程中,支持一边显示会议记录结果一边进行纪要编写,纪要模块至少支持“会议议题”、“会议结论”、“会议待办”模块。 (需提供产品功能截图证明)

★15.格式兼容:系统支持导入已经录制好的音视频文件进行转写,至少支持mp3、wav、m4a、amr、wma、MP4、AVI等音、视频格式。

16.批量上传:支持批量上传,至少支持20个文件同时上传,提高文件导入效率;单音频上传支持5小时。

★17. 说话人区分:支持对音频文件中的说话人进行分离,支持算法自动区分、支持指定说话人数量区分,支持不少于8个说话人识别。(需提供产品功能截图证明)

★18.字幕上屏:应支持对转写结果的字体、字号、中间结果颜色、终结果颜色以及页面的背景、logo、翻页效果、默认页进行自定义设置;除此以外还应支持对字幕的行数、底色等进行设置;实时上屏:应支持实时会议过程中,可以把会议内容以文本或字幕条的形式实时展示在连接的大屏幕上;同时利用设备自带视频采集卡或外接USB识别采集,均可实现外接视频信号与字幕叠加功能,并可实时上屏展示;上屏后台修改:应提供上屏后台修改功能,可对上屏后的结果进行纠正或者对不适内容进行清屏操作。

转写引擎主机

★1.CPU:不低于Intel Core I7-10750H
★2.内存不低于64GB

3.硬盘:不低于500GB SSD;