AVFoundation--文字转语音

iOS自带文字转语音功能，实现很简单，接下来我们就一起来学习这个简单酷炫的功能。

要实现文字转语音，我们只需要简单的几个类，从本文你将学到：

将文字（汉语、英语等）转化为语音输出
掌握语音合成器：AVSpeechSynthesizer，
语言设置：AVSpeechSynthesisVoice，
发声对象：AVSpeechUtterance的使用
文字转语音demo

其合成过程如下：由AVSpeechSynthesisVoice设置语言环境，AVSpeechUtterance设置需要转化的文字，并对语速、音调、音量等进行控制，最后由AVSpeechSynthesizer来进行播放。

AVSpeechSynthesisVoice
1、创建语言环境

//参数为需要设置的语言
AVSpeechSynthesisVoice *voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"zh-TW"];
//获取当前设置的语言
[AVSpeechSynthesisVoice currentLanguageCode];

2、获取支持的语言

//通过如下方法可以查看所支持的语言，可根据需要从中选取所需语言
NSArray *voices =  [AVSpeechSynthesisVoice speechVoices];
常用语言如下：
     en-GB//英语（英式）
     en-US//英语（美式）
     zh-CN//汉语（普通话）
     zh-HK//汉语（粤语）
     zh-TW//汉语（台湾）

AVSpeechUtterance

// 创建语音合成器
    AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
    
    // 实例化发声的对象
    AVSpeechUtterance *utterance = [AVSpeechUtterance speechUtteranceWithString:@"我有一只小毛驴"];
    //语言，为AVSpeechSynthesisVoice的一个对象
    utterance.voice = voice;    
    //语速,0~1
    utterance.rate = 0.5;
    //声音，0~1
    utterance.volume = 1;
    //音调0.5~2
    utterance.pitchMultiplier = 1;
    //播放前的延时
    utterance.preUtteranceDelay = 3;
    //播放后的延时，一般用于设置连续播放多段文字的间隔
    utterance.postUtteranceDelay = 1;

AVSpeechSynthesizer
1. 使用

AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
//播放
[synthesizer speakUtterance:utterance];

1. 方法介绍

//开始播放
- (void)speakUtterance:(AVSpeechUtterance *)utterance;
//停止播放，调用此方法会立刻停止，并清空utterance队列
- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//暂停播放
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//继续播放
- (BOOL)continueSpeaking;

需要说明的是调用speakUtterance:方法时其实是把utterance添加到播放队列，synthesizer会从该队列里面顺序取出utterance逐个播放，也就是我们可以一次性添加多个utterance，播放时则会顺序播放。

3.代理方法，如有需要可以在代理房中做一些处理

- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"开始：%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"暂停：%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"取消：%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance {
    NSLog(@"将要开始：%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"继续：%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"完成：%@",utterance.speechString);
}

Demo

写了一个简单的demo测试了一下，demo中仅有两个类，FireSpeecher用于播放控制，FireVoiceModely用于设置需要播放低文字及相关属性的配置：
1 FireSpeecher类：

typedef NS_ENUM(NSInteger, PauseType) {
    PauseTypeImmediate,//立刻停止
    PauseTypeByWord//读完本字（单词）后再停止
};

@interface FireSpeecher : NSObject

/**
 暂停或者停止类型
 */
@property (nonatomic, assign) PauseType pauseType;

/**
 初始化

 @param models 需要转化的文字Model
 @return FireSpeecher对象
 */
- (instancetype)initWithModels:(NSArray <FireVoiceModel *>*)models;

/**
播放

 @return YES-->播放成功，NO-->播放失败
 */
- (BOOL)speech;

/**
 暂停播放
 
 @return YES-->暂停成功，NO-->暂停失败
 */
- (BOOL)pausedSpeech;

/**
 停止
 
 @return YES-->停止成功，NO-->停止失败
 */
- (BOOL)stopeSpeech;
/**
 继续播放
 
 @return YES-->继续播放成功，NO-->继续播放失败
 */
- (BOOL)contiueSpeech;

2 FireVoiceModel类：

typedef NS_ENUM(NSInteger, LanguageType) {
  LanguageTypeDefault,//默认（普通话）
  LanguageTypeCH,//中文（普通话）
  LanguageTypeHK,//香港（粤语）
  LanguageTypeTW,//中文（台湾）
  LanguageTypeUS,//英语（美式）
  LanguageTypeEN//英语（英式）
};

@interface FireVoiceModel : NSObject

/**
要说的句子
*/
@property (nonatomic , copy) NSString *string;

/**
语言类型
*/
@property (nonatomic, assign) LanguageType languageType;

/**
说话速率，0~1，默认0.5
*/
@property (nonatomic, assign) CGFloat rate;

/**
音调，0.5~2.0，默认1.0
*/
@property (nonatomic, assign) CGFloat pinch;

/**
音量，0~1，默认为1
*/
@property (nonatomic, assign) CGFloat volume;

/**
说话前的时间，默认为0
*/
@property (nonatomic, assign) NSTimeInterval preDelay;

/**
说话后的延时时间，默认为0
*/
@property (nonatomic, assign) NSTimeInterval postDelay;

使用就很简单了，语言默认中文普通话，包括语速、音调可以在model中对每句话单独进行设置：

NSMutableArray *array = [NSMutableArray arrayWithCapacity:5];
    for (int i = 0; i < 5; i ++) {
        FireVoiceModel *model = [[FireVoiceModel alloc] init];
        model.string = @"哈哈";
        model.postDelay = 1;
        [array addObject:model];
    }
    FireSpeecher *speecher = [[FireSpeecher alloc] initWithModels:array];
    if ([speecher speech]) {
        NSLog(@"开讲啦");
    }else {
        NSLog(@"出错啦");
    }

Demo地址

AVFoundation--文字转语音

AVSpeechSynthesisVoice

AVSpeechUtterance

AVSpeechSynthesizer

Demo

推荐阅读更多精彩内容