AVFoundation--文字转语音

iOS自带文字转语音功能,实现很简单,接下来我们就一起来学习这个简单酷炫的功能。

要实现文字转语音,我们只需要简单的几个类,从本文你将学到:

  • 将文字(汉语、英语等)转化为语音输出
  • 掌握语音合成器:AVSpeechSynthesizer
    语言设置:AVSpeechSynthesisVoice
    发声对象:AVSpeechUtterance的使用
  • 文字转语音demo

其合成过程如下:由AVSpeechSynthesisVoice设置语言环境,AVSpeechUtterance设置需要转化的文字,并对语速、音调、音量等进行控制,最后由AVSpeechSynthesizer来进行播放。

  • AVSpeechSynthesisVoice

  • 1、创建语言环境
//参数为需要设置的语言
AVSpeechSynthesisVoice *voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"zh-TW"];
//获取当前设置的语言
[AVSpeechSynthesisVoice currentLanguageCode];
  • 2、获取支持的语言
//通过如下方法可以查看所支持的语言,可根据需要从中选取所需语言
NSArray *voices =  [AVSpeechSynthesisVoice speechVoices];
常用语言如下:
     en-GB//英语(英式)
     en-US//英语(美式)
     zh-CN//汉语(普通话)
     zh-HK//汉语(粤语)
     zh-TW//汉语(台湾)
  • AVSpeechUtterance

// 创建语音合成器
    AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
    
    // 实例化发声的对象
    AVSpeechUtterance *utterance = [AVSpeechUtterance speechUtteranceWithString:@"我有一只小毛驴"];
    //语言,为AVSpeechSynthesisVoice的一个对象
    utterance.voice = voice;    
    //语速,0~1
    utterance.rate = 0.5;
    //声音,0~1
    utterance.volume = 1;
    //音调0.5~2
    utterance.pitchMultiplier = 1;
    //播放前的延时
    utterance.preUtteranceDelay = 3;
    //播放后的延时,一般用于设置连续播放多段文字的间隔
    utterance.postUtteranceDelay = 1;

  • AVSpeechSynthesizer

    1. 使用
AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
//播放
[synthesizer speakUtterance:utterance];
    1. 方法介绍
//开始播放
- (void)speakUtterance:(AVSpeechUtterance *)utterance;
//停止播放,调用此方法会立刻停止,并清空utterance队列
- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//暂停播放
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//继续播放
- (BOOL)continueSpeaking;

需要说明的是调用speakUtterance:方法时其实是把utterance添加到播放队列,synthesizer会从该队列里面顺序取出utterance逐个播放,也就是我们可以一次性添加多个utterance,播放时则会顺序播放。

  • 3.代理方法,如有需要可以在代理 房中做一些处理
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"暂停:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"取消:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance {
    NSLog(@"将要开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"继续:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"完成:%@",utterance.speechString);
}

写了一个简单的demo测试了一下,demo中仅有两个类,FireSpeecher用于播放控制,FireVoiceModely用于设置需要播放低文字及相关属性的配置:
1 FireSpeecher类:

typedef NS_ENUM(NSInteger, PauseType) {
    PauseTypeImmediate,//立刻停止
    PauseTypeByWord//读完本字(单词)后再停止
};

@interface FireSpeecher : NSObject

/**
 暂停或者停止类型
 */
@property (nonatomic, assign) PauseType pauseType;

/**
 初始化

 @param models 需要转化的文字Model
 @return FireSpeecher对象
 */
- (instancetype)initWithModels:(NSArray <FireVoiceModel *>*)models;

/**
播放

 @return YES-->播放成功,NO-->播放失败
 */
- (BOOL)speech;

/**
 暂停播放
 
 @return YES-->暂停成功,NO-->暂停失败
 */
- (BOOL)pausedSpeech;

/**
 停止
 
 @return YES-->停止成功,NO-->停止失败
 */
- (BOOL)stopeSpeech;
/**
 继续播放
 
 @return YES-->继续播放成功,NO-->继续播放失败
 */
- (BOOL)contiueSpeech;

2 FireVoiceModel类:

typedef NS_ENUM(NSInteger, LanguageType) {
  LanguageTypeDefault,//默认(普通话)
  LanguageTypeCH,//中文(普通话)
  LanguageTypeHK,//香港(粤语)
  LanguageTypeTW,//中文(台湾)
  LanguageTypeUS,//英语(美式)
  LanguageTypeEN//英语(英式)
};

@interface FireVoiceModel : NSObject

/**
要说的句子
*/
@property (nonatomic , copy) NSString *string;

/**
语言类型
*/
@property (nonatomic, assign) LanguageType languageType;

/**
说话速率,0~1,默认0.5
*/
@property (nonatomic, assign) CGFloat rate;

/**
音调,0.5~2.0,默认1.0
*/
@property (nonatomic, assign) CGFloat pinch;

/**
音量,0~1,默认为1
*/
@property (nonatomic, assign) CGFloat volume;

/**
说话前的时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval preDelay;

/**
说话后的延时时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval postDelay;

使用就很简单了,语言默认中文普通话,包括语速、音调可以在model中对每句话单独进行设置:

NSMutableArray *array = [NSMutableArray arrayWithCapacity:5];
    for (int i = 0; i < 5; i ++) {
        FireVoiceModel *model = [[FireVoiceModel alloc] init];
        model.string = @"哈哈";
        model.postDelay = 1;
        [array addObject:model];
    }
    FireSpeecher *speecher = [[FireSpeecher alloc] initWithModels:array];
    if ([speecher speech]) {
        NSLog(@"开讲啦");
    }else {
        NSLog(@"出错啦");
    }

Demo地址

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近项目刚刚交付,偶然间用到了语音播报和语音搜索的功能。语音搜索我用的是讯飞的demo,感觉效果还不错,感兴趣的话...
    奔跑的小蚂蚁_8b28阅读 8,538评论 13 6
  • 发现 关注 消息 iOS 第三方库、插件、知名博客总结 作者大灰狼的小绵羊哥哥关注 2017.06.26 09:4...
    肇东周阅读 12,263评论 4 61
  • (这是许6569 365日小能熊写作计划第71篇文章) 听上一届的哥哥说,每年都有春游。我心花怒放。啥时候去呢?...
    许6569阅读 1,131评论 3 1
  • 文:陳奕。 万宝路小姐并不是叫万宝路,因为她喜欢抽烟,所以才给她取这个名字,原本是想叫她香烟小姐的,但是这个名字并...
    深西陈奕阅读 918评论 2 9
  • 金。 金色。大片大片的金。 没有恶心作呕的味道,没有难以下脚的墨绿苔藓,没有嗡嗡作响的飞虫。 青行灯愣住了。她想过...
    就来箱旺仔牛奶吧阅读 921评论 0 5