本文主要是介绍Pyttsx3+Windows语音合成不同的声音,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
""" # ******************************************************************************** # python如何实现文字转语音,并且解决发声生硬的问题。 # ********************************************************************************** """# 在Python中,你可以使用不同的库来实现文字转语音的功能。以下是一些常用的库: # # * `pyttsx3`:这是一个Python语音合成库,可以将文本转换为语音。 # * `gTTS`:这是一个Google Text-to-Speech API的Python客户端,可以将文本转换为语音。 # * `espeak`:这是一个开源的语音合成引擎,可以将文本转换为语音。 # # # 这些库都可以帮助你实现文字转语音的功能,但是它们的发音效果可能会有所不同。如果你想要解决发声生硬的问题,你可以尝试以下方法: # # * 使用不同的语音合成引擎:不同的语音合成引擎可能会有不同的发音效果,你可以尝试使用不同的引擎来找到最适合你的发音效果。 # * 调整语音合成引擎的参数:许多语音合成引擎都提供了参数调整的功能,你可以尝试调整这些参数来改善发音效果。 # * 使用不同的语音合成库:不同的语音合成库可能会有不同的发音效果,你可以尝试使用不同的库来找到最适合你的发音效果。
如何支持多国语言:
首先windows先添加语音,方法如下:
电脑系统图标键,找到windows设置,或者设置, --时间与语言---点击添加语音--管理语言---添加语音 # ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-GB_HAZEL_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_DAVID_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_ZIRA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ES-ES_HELENA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ES-MX_SABINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_FR-FR_HORTENSE_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_IT-IT_ELSA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_KO-KR_HEAMI_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_PL-PL_PAULINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_PT-BR_MARIA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_RU-RU_IRINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_DE-DE_HEDDA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-HK_TRACY_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-TW_HANHAN_11.0"""
"""# ************************************************************************************************************* # python如何实现文字转语音,并且解决发声生硬的问题。 ********* # *************************************************************************************************************"""# 在Python中,你可以使用不同的库来实现文字转语音的功能。以下是一些常用的库: # # * `pyttsx3`:这是一个Python语音合成库,可以将文本转换为语音。 # * `gTTS`:这是一个Google Text-to-Speech API的Python客户端,可以将文本转换为语音。 # * `espeak`:这是一个开源的语音合成引擎,可以将文本转换为语音。 # # # 这些库都可以帮助你实现文字转语音的功能,但是它们的发音效果可能会有所不同。如果你想要解决发声生硬的问题,你可以尝试以下方法: # # * 使用不同的语音合成引擎:不同的语音合成引擎可能会有不同的发音效果,你可以尝试使用不同的引擎来找到最适合你的发音效果。 # * 调整语音合成引擎的参数:许多语音合成引擎都提供了参数调整的功能,你可以尝试调整这些参数来改善发音效果。 # * 使用不同的语音合成库:不同的语音合成库可能会有不同的发音效果,你可以尝试使用不同的库来找到最适合你的发音效果。 """# ************************************************************************************************************* # python pyttsx3语音合成 pyttsx3如何让发音显得更自然一点,默认的有一些僵硬。 ********* # ************************************************************************************************************* """# 在`pyttsx3`库中,你可以使用`setProperty`方法来设置语音合成引擎的参数,包括语速、音调和音量等。以下是一些常用的方法: # # * `setProperty(name, value)`:设置语音合成引擎的参数。`name`是参数的名称,`value`是参数的值。 # * `setProperty('rate', rate)`:设置语音合成引擎的语速。`rate`是语速的值,范围是0.0到10.0,其中0.0表示最慢,10.0表示最快。 # * `setProperty('volume', volume)`:设置语音合成引擎的音量。`volume`是音量的值,范围是0.0到1.0,其中0.0表示无声,1.0表示最大音量。 # * `setProperty('pitch', pitch)`:设置语音合成引擎的音调。`pitch`是音调的值,范围是0.0到1.0,其中0.0表示最低音调,1.0表示最高音调。 # # 你可以使用这些方法来设置语音合成引擎的参数,以改善发音效果。例如,你可以使用以下代码来设置语音合成引擎的语速为1.0(正常语速),音量为1.0(最大音量),音调为1.0(最高音调): # # ```python # import pyttsx3 # # engine = pyttsx3.init() # engine.setProperty('rate', 1.0) # engine.setProperty('volume', 1.0) # engine.setProperty('pitch', 1.0) # engine.say('Hello, world!') # engine.runAndWait() # ``` # # 在这个例子中,我们使用`setProperty`方法将语音合成引擎的语速、音量和音调设置为正常值,然后将文本'Hello, world!'转换为语音,并播放出来。 # # 你也可以尝试调整这些参数的值,以找到最适合你的发音效果。 # 例如,你可以尝试将语速设置为0.5(慢速),音量设置为0.5(小音量),音调设置为0.5(低音调),以使发音显得更自然。 """ # ************************************************************************************************************* # python pyttsx3 保存为文件 。 ********* # ************************************************************************************************************* """ # 在`pyttsx3`库中,你可以使用`saveToWaveFile`方法将语音保存为WAV文件。以下是一个例子: # # ```python # import pyttsx3 # # engine = pyttsx3.init() # engine.setProperty('rate', 1.0) # engine.setProperty('volume', 1.0) # engine.setProperty('pitch', 1.0) # # text = 'Hello, world!' # engine.say(text) # engine.runAndWait() # # engine.saveToWaveFile('output.wav') # ``` # # 在这个例子中,我们首先使用`init`方法初始化语音合成引擎,然后使用`setProperty`方法将语速、音量和音调设置为正常值。然后,我们使用`say`方法将文本转换为语音,并使用`runAndWait`方法播放出来。最后,我们使用`saveToWaveFile`方法将语音保存为名为`output.wav`的WAV文件。 # # 注意,你需要将`output.wav`替换为你想要保存的文件的路径和名称。 """# ************************************************************************************************************* # python 使用pydub库将wave文件转换为mp3文件 。 ********* # ************************************************************************************************************* """ # # 使用pydub库将wave文件转换为mp3文件 # audio = AudioSegment.from_wav('output.wav') # audio.export('output.mp3', format='mp3')""" # ************************************************************************************************************* # python # 设置发音人(这里设置为电脑默认发音人) 。 *********voices如下,可以选择自己喜欢的声音。 com.apple.speech.synthesis.voice.Alex com.apple.speech.synthesis.voice.alice.premium com.apple.speech.synthesis.voice.alva com.apple.speech.synthesis.voice.amelie com.apple.speech.synthesis.voice.anna com.apple.speech.synthesis.voice.carmit com.apple.speech.synthesis.voice.damayanti com.apple.speech.synthesis.voice.daniel com.apple.speech.synthesis.voice.diego com.apple.speech.synthesis.voice.ellen com.apple.speech.synthesis.voice.fiona com.apple.speech.synthesis.voice.Fred com.apple.speech.synthesis.voice.ioana com.apple.speech.synthesis.voice.joana com.apple.speech.synthesis.voice.jorge com.apple.speech.synthesis.voice.juan com.apple.speech.synthesis.voice.kanya com.apple.speech.synthesis.voice.karen com.apple.speech.synthesis.voice.kyoko com.apple.speech.synthesis.voice.laura com.apple.speech.synthesis.voice.lekha com.apple.speech.synthesis.voice.luca com.apple.speech.synthesis.voice.luciana com.apple.speech.synthesis.voice.maged com.apple.speech.synthesis.voice.mariska com.apple.speech.synthesis.voice.meijia com.apple.speech.synthesis.voice.melina com.apple.speech.synthesis.voice.milena com.apple.speech.synthesis.voice.moira com.apple.speech.synthesis.voice.monica com.apple.speech.synthesis.voice.nora com.apple.speech.synthesis.voice.paulina com.apple.speech.synthesis.voice.rishi com.apple.speech.synthesis.voice.samantha com.apple.speech.synthesis.voice.sara com.apple.speech.synthesis.voice.satu com.apple.speech.synthesis.voice.sinji com.apple.speech.synthesis.voice.tessa com.apple.speech.synthesis.voice.thomas com.apple.speech.synthesis.voice.tingting.premium com.apple.speech.synthesis.voice.veena com.apple.speech.synthesis.voice.Victoria com.apple.speech.synthesis.voice.xander com.apple.speech.synthesis.voice.yelda com.apple.speech.synthesis.voice.yuna com.apple.speech.synthesis.voice.yuri com.apple.speech.synthesis.voice.zosia com.apple.speech.synthesis.voice.zuzanapyttsx3支持多种语音合成引擎,包括: MAC com.apple.speech.synthesis.voice.Alex WINDOWS Microsoft Speech API(SAPI) /Microsoft David Desktop (TTS Engine) Google Text-to-Speech Amazon Polly espeak-ng pip install espeak-ng eSpeak Festival MaryTTS Pico TTS MyTTS iFLYTEK TTS 其中,Microsoft Speech API是Windows系统默认的语音合成引擎, 而Google Text-to-Speech和Amazon Polly需要联网才能使用。其他语音合成引擎可能需要安装额外的库或软件。如: From source: $ git clone https://github.com/TensorSpeech/TensorFlowTTS.git $ cd TensorFlowTTS $ pip install .If you want to upgrade the repository and its dependencies: $ git pull $ pip install --upgrade . # ************************************************************************************************************* """ # 这段代码是使用Python的pyttsx3库来设置发音人的。在这个例子中,发音人被设置为电脑默认的Alex。 # 这个设置会告诉pyttsx3库在发音时应该使用哪个语音合成引擎。 # # ```python # import pyttsx3 # # engine = pyttsx3.init() # engine.setProperty('voice', 'com.apple.speech.synthesis.voice.Alex') # ``` # # 在这个代码中,首先导入了pyttsx3库,然后初始化了一个新的语音合成引擎。然后,使用setProperty方法来设置发音人。最后,这个新的语音合成引擎就可以用来发音了。 # # 注意,这个设置可能只在你运行这段代码的电脑上有效。 # 如果你在另一台电脑上运行这段代码,你可能需要设置不同的发音人。# 要将wav文件中的机器声音转换成人声,可以使用深度学习模型,例如WaveNet。以下是使用Python和TensorFlow实现的步骤: # # 安装所需库: # # bash # 复制代码 # pip install tensorflow - gpu == 2.6 # pip install librosa # # 下载预训练的WaveNet模型: # # bash # 复制代码 # wget # https: // storage.googleapis.com / download.tensorflow.org / models / wavenet_vocoder / wavenet_vocoder.zip # unzip # wavenet_vocoder.zip # # 将音频文件转换为适合WaveNet输入的格式: # # python # 复制代码 # import librosa # import numpy as np # # # def preprocess_audio(file_path): # y, sr = librosa.load(file_path) # input_length = 8000 # if len(y) > input_length: # y = y[:input_length] # else: # y = np.pad(y, (0, max(0, input_length - len(y))), 'constant') # return y, sr # # # input_audio, sample_rate = preprocess_audio('input.wav') # # 使用WaveNet模型进行转换: # # python # 复制代码 # import tensorflow as tf # from wavenet_vocoder import WaveNetVocoder # # # def convert_audio(input_audio, sample_rate): # vocoder = WaveNetVocoder() # output_audio = vocoder.infer(input_audio, sample_rate) # return output_audio # # # output_audio = convert_audio(input_audio, sample_rate) # # 保存转换后的音频文件: # # python # 复制代码 # import soundfile as sf # sf.write('output.wav', output_audio, sample_rate) # # 这样,你就可以将wav文件中的机器声音转换成人声了。注意,这个示例仅适用于简单的音频转换任务,对于更复杂的场景,可能需要使用更高级的模型和方法。
案例程序:"""* `pyttsx3`:这是一个Python语音合成库,可以将文本转换为语音。pip install pyttsx3使用`pyaudio`或`sounddevice`库来播放音频pip install pyaudio sapi5,即Microsoft Speech API 5,是微软发布的一个文本转语音(Text-to-Speech)引擎。 它内置在Windows系统中,例如Windows XP内置了TTS语音引擎SAPI5.1,Vista、Server 2008内置SAPI5.3,Win7内置SAPI5.4,无需额外安装。pyttsx3是一个文本到语音转换的Python库,它支持多种TTS引擎包括SAPI5、NSSS(NSSpeechSynthesizer)、espeak等。 通过pyttsx3的使用,我们可以方便地实现文字转语音的功能。例如,首先需要安装pyttsx3和pywin32库,然后使用以下代码即可将文字转化为语音: """import pyttsx3 import pyaudio# 初始化语音合成引擎engine = pyttsx3.init() # mac # engine.setProperty('voice', 'com.apple.speech.synthesis.voice.Alex') # Microsoft David Desktop (TTS Engine) windows # engine.setProperty('voice', 'Microsoft David Desktop (TTS Engine)') # engine.setProperty('voice', 'com.apple.speech.synthesis.voice.sinji') with open('tts_data_zh_CN.txt', 'r', encoding='utf-8') as f:text = f.read() engine.setProperty('language', 'ja') engine.setProperty('rate', 150) engine.setProperty('volume', 0.5) engine.setProperty('pitch', 0.0) engine.setProperty('emphasis', 50) # 设置强调程度为50 engine.setProperty('spell', True) # engine.setProperty('language', 'en') voices = engine.getProperty('voices') # for voice in voices: # print ('id = {} \nname = {} \n'.format(voice.id, voice.name)) # # engine.setProperty('voice', voices[1].id) #设置发音人 engine.setProperty('voice', 'HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0') engine.say(text) engine.runAndWait()for voice in voices:print("---" * 10, voice.id) # engine.save_to_file(text=text, filename='output112.wav') # # engine.setProperty('voice', voice.id) # # engine.setProperty('voice', "com.apple.speech.synthesis.voice.sin-ji") # engine.say("以官网云教学平台演示为例,首先我们可以登录到大尧科技的官网,点击产品中心就可以看到我们的云教学平台:Hello !") # engine.runAndWait() # engine.stop()珍惜
珍惜成果,拿走请留香!!
珍惜成果,拿走请留香!!
珍惜成果,拿走请留香!!
这篇关于Pyttsx3+Windows语音合成不同的声音的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!