Book a demo
Feedback
Overview
Analysis
Japanese Naturalness and quality comparison of multiple TTS models
Japanese Naturalness and quality comparison of multiple TTS models including ElevenLabs, Supertone, Naver, Typecast, Cartesia and Google Cloud
Translate to English
Loading...
Loading...
Question 1. 人間の声優が話しているように聞こえる度合いはどのくらいですか?
Single select | Scored | 5 radio buttons
Overall
MAX 5
完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4
良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3
普通の自然さ – いくつかの不自然な要素がある
2
不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
MIN 1
不自然 – 非常にロボット的または人工的で、明らかに合成された声
MAX 5
完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4
良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3
普通の自然さ – いくつかの不自然な要素がある
2
不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
MIN 1
不自然 – 非常にロボット的または人工的で、明らかに合成された声
Models
By Tag
Model
Tag
MAX 5
完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4
良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3
普通の自然さ – いくつかの不自然な要素がある
2
不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
MIN 1
不自然 – 非常にロボット的または人工的で、明らかに合成された声
MAX 5
完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4
良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3
普通の自然さ – いくつかの不自然な要素がある
2
不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
MIN 1
不自然 – 非常にロボット的または人工的で、明らかに合成された声
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
Tags
Answers
5. 完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4. 良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3. 普通の自然さ – いくつかの不自然な要素がある
2. 不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
1. 不自然 – 非常にロボット的または人工的で、明らかに合成された声
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
322 (32.20%)
309 (30.90%)
207 (20.70%)
111 (11.10%)
51 (5.10%)
455 (45.50%)
332 (33.20%)
158 (15.80%)
45 (4.50%)
10 (1.00%)
446 (44.60%)
315 (31.50%)
140 (14.00%)
71 (7.10%)
28 (2.80%)
284 (28.40%)
364 (36.40%)
210 (21.00%)
98 (9.80%)
44 (4.40%)
316 (31.60%)
280 (28.00%)
222 (22.20%)
136 (13.60%)
46 (4.60%)
36 (3.60%)
154 (15.40%)
346 (34.60%)
280 (28.00%)
184 (18.40%)
5. 完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4. 良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3. 普通の自然さ – いくつかの不自然な要素がある
2. 不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
1. 不自然 – 非常にロボット的または人工的で、明らかに合成された声
Tags
All tags
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
322 (32.20%)
455 (45.50%)
446 (44.60%)
284 (28.40%)
316 (31.60%)
36 (3.60%)
Deep analysis
Distribution
Mean
Files
5. 完全に自然 – 本物の人間の声のように聞こえ、不自然な要素は検出されない
4. 良好な自然さ – ほとんど自然で、ごくわずかな合成的要素のみ
3. 普通の自然さ – いくつかの不自然な要素がある
2. 不十分な自然さ – 不自然な要素が目立ち、人間の声として認識しにくい
1. 不自然 – 非常にロボット的または人工的で、明らかに合成された声
MAX 5
4
3
2
MIN 1
MAX 5
4
3
2
MIN 1
Models: All models
Tags: All tags
Filename
Model
Tags
Statistics
x̅
CI
σ
x̅
00:00
--:--
Naver - tts-premium_General
Naver - tts-premium
FEMALE
General
NARRATIVE
naver
tts-premium
x̅
4.70
CI
0.68
σ
x̅
0.30
00:00
--:--
Naver - tts-premium_Mixed
Naver - tts-premium
FEMALE
Mixed
NARRATIVE
naver
tts-premium
x̅
3.80
CI
0.56
σ
x̅
0.25
00:00
--:--
Naver - tts-premium_General
Naver - tts-premium
FEMALE
General
NARRATIVE
naver
tts-premium
x̅
4.30
CI
0.48
σ
x̅
0.21
00:00
--:--
Supertone - sona_speech_1_General
Supertone - sona_speech_1
FEMALE
General
YOUNG_ADULT
x̅
4.90
CI
0.23
σ
x̅
0.10
00:00
--:--
Cartesia - sonic-3_Number
Cartesia - sonic-3
FEMALE
Number
x̅
4.40
CI
0.50
σ
x̅
0.22
00:00
--:--
Naver - tts-premium_Number
Naver - tts-premium
MALE
NARRATIVE
Number
naver
tts-premium
x̅
3.50
CI
0.51
σ
x̅
0.22
00:00
--:--
Typecast - ssfm-v21_Mixed
Typecast - ssfm-v21
MALE
Mixed
x̅
2.40
CI
0.69
σ
x̅
0.31
00:00
--:--
Typecast - ssfm-v21_General
Typecast - ssfm-v21
FEMALE
General
x̅
2.90
CI
0.41
σ
x̅
0.18
1
2
3
4
5
...
75
Question 2. 声がどの程度明瞭で、アーチファクトやノイズがないかを評価してください。
Single select | Scored | 5 radio buttons
Overall
MAX 5
優れている
4
良い
3
可もなく不可もなし
2
悪い
MIN 1
非常に悪い
MAX 5
優れている
4
良い
3
可もなく不可もなし
2
悪い
MIN 1
非常に悪い
Models
By Tag
Model
Tag
MAX 5
優れている
4
良い
3
可もなく不可もなし
2
悪い
MIN 1
非常に悪い
MAX 5
優れている
4
良い
3
可もなく不可もなし
2
悪い
MIN 1
非常に悪い
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
Tags
Answers
5. 優れている
4. 良い
3. 可もなく不可もなし
2. 悪い
1. 非常に悪い
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
320 (32.00%)
245 (24.50%)
188 (18.80%)
183 (18.30%)
64 (6.40%)
678 (67.80%)
222 (22.20%)
79 (7.90%)
20 (2.00%)
1 (0.10%)
505 (50.50%)
226 (22.60%)
165 (16.50%)
98 (9.80%)
6 (0.60%)
483 (48.30%)
263 (26.30%)
156 (15.60%)
86 (8.60%)
12 (1.20%)
708 (70.80%)
218 (21.80%)
61 (6.10%)
13 (1.30%)
0 (0.00%)
630 (63.00%)
220 (22.00%)
125 (12.50%)
23 (2.30%)
2 (0.20%)
5. 優れている
4. 良い
3. 可もなく不可もなし
2. 悪い
1. 非常に悪い
Tags
All tags
Cartesia - sonic-3
ElevenLabs - eleven_v3
Google Cloud - Chirp3-HD
Naver - tts-premium
Supertone - sona_speech_1
Typecast - ssfm-v21
320 (32.00%)
678 (67.80%)
505 (50.50%)
483 (48.30%)
708 (70.80%)
630 (63.00%)
Deep analysis
Distribution
Mean
Files
5. 優れている
4. 良い
3. 可もなく不可もなし
2. 悪い
1. 非常に悪い
MAX 5
4
3
2
MIN 1
MAX 5
4
3
2
MIN 1
Models: All models
Tags: All tags
Filename
Model
Tags
Statistics
x̅
CI
σ
x̅
00:00
--:--
Naver - tts-premium_General
Naver - tts-premium
FEMALE
General
NARRATIVE
naver
tts-premium
x̅
5.00
CI
0.00
σ
x̅
0.00
00:00
--:--
Naver - tts-premium_Mixed
Naver - tts-premium
FEMALE
Mixed
NARRATIVE
naver
tts-premium
x̅
4.90
CI
0.23
σ
x̅
0.10
00:00
--:--
Naver - tts-premium_General
Naver - tts-premium
FEMALE
General
NARRATIVE
naver
tts-premium
x̅
5.00
CI
0.00
σ
x̅
0.00
00:00
--:--
Supertone - sona_speech_1_General
Supertone - sona_speech_1
FEMALE
General
YOUNG_ADULT
x̅
5.00
CI
0.00
σ
x̅
0.00
00:00
--:--
Cartesia - sonic-3_Number
Cartesia - sonic-3
FEMALE
Number
x̅
4.80
CI
0.30
σ
x̅
0.13
00:00
--:--
Naver - tts-premium_Number
Naver - tts-premium
MALE
NARRATIVE
Number
naver
tts-premium
x̅
4.40
CI
0.50
σ
x̅
0.22
00:00
--:--
Typecast - ssfm-v21_Mixed
Typecast - ssfm-v21
MALE
Mixed
x̅
4.90
CI
0.23
σ
x̅
0.10
00:00
--:--
Typecast - ssfm-v21_General
Typecast - ssfm-v21
FEMALE
General
x̅
4.90
CI
0.23
σ
x̅
0.10
1
2
3
4
5
...
75
Annotations (beta)
Annotations (beta)
Q5
Q14
Q19
Q24
Q33
Q34
Q39
Q40
Q44
Q48
Q49
Q61
Q81
Q94
Q98
Q99
Q100
Q113
Q123
Q125
Q142
Q152
Q153
Q156
Q157
Q164
Q165
Q168
Q171
Q183
Q198
Q209
Q218
Q219
Q220
Q230
Q240
Q241
Q258
Q266
Q275
Q286
Q287
Q294
Q304
Q305
Q308
Q316
Q325
Q333
Q334
Q338
Q342
Q352
Q355
Q360
Q366
Q369
Q378
Q380
Q381
Q395
Q399
Q404
Q409
Q410
Q414
Q424
Q425
Q435
Q469
Q471
Q476
Q482
Q496
Q503
Q511
Q515
Q521
Q523
Q524
Q527
Q530
Q533
Q535
Q536
Q541
Q544
Q545
Q550
Q556
Q557
Q559
Q563
Q566
Q576
Q581
Q585
Q586
Q598
Q15
Q20
Q29
Q38
Q41
Q51
Q54
Q56
Q62
Q67
Q75
Q80
Q84
Q85
Q88
Q89
Q105
Q107
Q111
Q114
Q117
Q122
Q129
Q131
Q133
Q134
Q145
Q146
Q150
Q162
Q163
Q167
Q173
Q177
Q194
Q203
Q206
Q208
Q215
Q217
Q236
Q244
Q249
Q250
Q262
Q267
Q268
Q283
Q288
Q303
Q306
Q307
Q317
Q321
Q328
Q335
Q336
Q340
Q345
Q350
Q359
Q363
Q373
Q374
Q375
Q377
Q383
Q384
Q388
Q391
Q394
Q397
Q411
Q416
Q430
Q431
Q436
Q439
Q443
Q444
Q449
Q450
Q467
Q473
Q474
Q481
Q483
Q494
Q507
Q508
Q525
Q537
Q549
Q552
Q555
Q561
Q569
Q570
Q584
Q599
Q13
Q25
Q30
Q36
Q52
Q55
Q57
Q68
Q70
Q79
Q82
Q96
Q97
Q103
Q106
Q124
Q135
Q136
Q143
Q147
Q148
Q158
Q170
Q185
Q193
Q195
Q196
Q199
Q204
Q205
Q210
Q211
Q216
Q227
Q239
Q247
Q261
Q263
Q269
Q272
Q282
Q285
Q289
Q297
Q310
Q313
Q314
Q315
Q324
Q329
Q337
Q351
Q354
Q356
Q358
Q362
Q364
Q376
Q387
Q389
Q393
Q396
Q401
Q402
Q403
Q406
Q412
Q413
Q426
Q428
Q434
Q440
Q448
Q451
Q455
Q456
Q461
Q463
Q465
Q466
Q475
Q478
Q484
Q487
Q500
Q502
Q505
Q509
Q510
Q538
Q543
Q546
Q551
Q575
Q587
Q589
Q591
Q594
Q597
Q600
Q1
Q2
Q3
Q6
Q10
Q17
Q18
Q21
Q22
Q37
Q42
Q50
Q53
Q58
Q59
Q69
Q71
Q73
Q74
Q86
Q90
Q95
Q118
Q126
Q128
Q139
Q140
Q144
Q149
Q159
Q160
Q161
Q178
Q180
Q187
Q188
Q191
Q192
Q213
Q214
Q223
Q234
Q235
Q243
Q246
Q252
Q255
Q256
Q257
Q260
Q264
Q265
Q273
Q279
Q281
Q284
Q292
Q295
Q298
Q312
Q326
Q332
Q341
Q346
Q347
Q349
Q353
Q371
Q372
Q386
Q392
Q398
Q400
Q407
Q415
Q418
Q420
Q421
Q423
Q432
Q454
Q460
Q470
Q486
Q492
Q495
Q498
Q504
Q516
Q518
Q522
Q526
Q540
Q553
Q558
Q562
Q564
Q574
Q580
Q595
Q497
Q4
Q9
Q11
Q16
Q23
Q26
Q28
Q35
Q45
Q46
Q47
Q63
Q66
Q72
Q76
Q78
Q87
Q92
Q102
Q109
Q110
Q112
Q115
Q119
Q120
Q121
Q127
Q132
Q138
Q141
Q172
Q175
Q176
Q179
Q182
Q184
Q186
Q190
Q201
Q202
Q207
Q225
Q226
Q228
Q237
Q238
Q242
Q251
Q253
Q259
Q271
Q278
Q301
Q302
Q309
Q318
Q322
Q327
Q339
Q343
Q344
Q370
Q385
Q390
Q408
Q419
Q429
Q433
Q437
Q438
Q441
Q447
Q457
Q458
Q459
Q464
Q480
Q488
Q489
Q506
Q513
Q514
Q517
Q519
Q520
Q529
Q532
Q534
Q548
Q554
Q560
Q567
Q571
Q578
Q579
Q583
Q588
Q590
Q593
Q7
Q8
Q12
Q27
Q31
Q32
Q43
Q60
Q64
Q65
Q77
Q83
Q91
Q93
Q101
Q104
Q108
Q116
Q130
Q137
Q151
Q154
Q155
Q166
Q169
Q174
Q181
Q189
Q197
Q200
Q212
Q221
Q222
Q224
Q229
Q231
Q232
Q233
Q245
Q248
Q254
Q270
Q274
Q276
Q277
Q280
Q290
Q291
Q293
Q296
Q299
Q300
Q311
Q319
Q320
Q323
Q330
Q331
Q348
Q357
Q361
Q365
Q367
Q368
Q379
Q382
Q405
Q417
Q422
Q427
Q442
Q445
Q446
Q452
Q453
Q462
Q468
Q472
Q477
Q479
Q485
Q490
Q491
Q493
Q499
Q501
Q512
Q528
Q531
Q539
Q542
Q547
Q565
Q568
Q572
Q573
Q577
Q582
Q592
Q596