修复按英文句号切分bug和英文前端处理问题 #1796

Cosmo-klara · 2024-11-20T14:30:55Z

修复按英文句号切分bug和英文前端处理问题

解决 issue #1690 #1725

修复按英文句号切分方式

改动位置：

..\GPT_SoVITS\TTS_infer_pack\text_segmentation_method.py
..\GPT_SoVITS\TTS_infer_pack\TextPreprocessor.py

总结：解决了按英文句号切分会异常切分小数点及序号项的问题。详细的说明参见 #1700

英文前端处理的问题修复

详细内容 #1725

改动位置：

新增 ..\GPT_SoVITS\text\en_normalization\expend.py
..\GPT_SoVITS\text\english.py

改动说明：

from g2p_en.expand import normalize_numbers 以此导入的处理函数为基准新增 ..\GPT_SoVITS\text\en_normalization\expend.py 来处理切句后的输入，导入为 from text.en_normalization.expend import normalize。

新增代码中有较为详细的注释介绍其功能

相较于原 g2p_en 新增的功能如下：
- 序号识别并转化为序数词
- 数字时间英文 12 时制转化 (eg. 4:00、13:30)
- 后缀计量单位识别与转化 (m|km|km/h|ft|L|tbsp|tsp|h|min|s|°C|°F)
- £/$ 的前后缀识别转化, 修正读法
- 小数识别与转化, 修正读法
- 分数识别与转化
- 添加 "-" \ "%" 的处理转化
有待实现的部分 ( 但不确定是否有需求 )
- 电话号码的转化: 目前会当作正常数字转化
- 数学计算式子的转化: 如何区分存不同含义的相同符号
- 。。。
略微调整 ..\GPT_SoVITS\text\english.py 中内容，将 text_normalize 函数中的部分处理移入新增的 en_normalization\expend.py 中。

从 DDL 中抽出身来了终于hh，已经同步了期间的更新，应该没有冲突

修改按英文句号.切分方式

删除punctuation中的“ ”，以便于按英文句号切分

修改代码风格和zh处理保持一致

删除了英文预处理的过滤器

添加英文序号转化

new file: GPT_SoVITS/text/en_normalization/expend.py modified: GPT_SoVITS/text/english.py

modified: GPT_SoVITS/text/english.py

去除不必要的过滤器让前端处理部分得以在正常（非fast）infer下正常工作

Cosmo-klara added 9 commits October 18, 2024 01:03

Update text_segmentation_method.py

395f97a

修改按英文句号.切分方式

Update TextPreprocessor.py

5aeb544

删除punctuation中的“ ”，以便于按英文句号切分

Update english.py

6520951

Update english.py

331d176

修改代码风格和zh处理保持一致

Update TextPreprocessor.py

c315203

删除了英文预处理的过滤器

Update english.py

96fc13b

添加英文序号转化

Merge branch 'RVC-Boss:main' into main

787881a

modified: GPT_SoVITS/TTS_infer_pack/TextPreprocessor.py

d6222bc

new file: GPT_SoVITS/text/en_normalization/expend.py modified: GPT_SoVITS/text/english.py

modified: GPT_SoVITS/text/en_normalization/expend.py

604823b

modified: GPT_SoVITS/text/english.py

This was referenced Nov 20, 2024

Fix bug in #1690 #1700

Closed

英文前端处理部分的一些问题 #1725

Open

Cosmo-klara added 2 commits December 11, 2024 02:44

去除不必要的过滤器让前端处理部分正常工作

f6d0165

去除不必要的过滤器让前端处理部分得以在正常（非fast）infer下正常工作

调整minus识别，防止误识别转化

401c275

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

修复按英文句号切分bug和英文前端处理问题 #1796

修复按英文句号切分bug和英文前端处理问题 #1796

Cosmo-klara commented Nov 20, 2024 •

edited

Loading

修复按英文句号切分bug和英文前端处理问题 #1796

Are you sure you want to change the base?

修复按英文句号切分bug和英文前端处理问题 #1796

Conversation

Cosmo-klara commented Nov 20, 2024 • edited Loading