Book a demo
Feedback
Overview
Analysis
Japanese Naturalness and quality comparison of multiple TTS models
Japanese Naturalness and quality comparison of multiple TTS models including Open AI, Clova, Eleven Labs, Supertone, LMNT and Lovo
Translate to English
Loading...
Loading...
Question 1. 音声サンプルを聞いて、どの程度自然であるか評価してください。
Single select | Scored | 5 radio buttons
Overall
MAX 5
優れている
4
良い
3
普通
2
悪い
MIN 1
とても悪い
MAX 5
優れている
4
良い
3
普通
2
悪い
MIN 1
とても悪い
Models
By Tag
X-axis
Model
Tag
MAX 5
優れている
4
良い
3
普通
2
悪い
MIN 1
とても悪い
MAX 5
優れている
4
良い
3
普通
2
悪い
MIN 1
とても悪い
model_1
model_2
model_3
model_4
model_5
model_6
Tags
Answers
5. 優れている
4. 良い
3. 普通
2. 悪い
1. とても悪い
model_1
model_2
model_3
model_4
model_5
model_6
20 (20.00%)
31 (31.00%)
32 (32.00%)
15 (15.00%)
2 (2.00%)
19 (19.00%)
14 (14.00%)
25 (25.00%)
33 (33.00%)
9 (9.00%)
21 (21.00%)
25 (25.00%)
41 (41.00%)
11 (11.00%)
2 (2.00%)
1 (1.00%)
4 (4.00%)
21 (21.00%)
35 (35.00%)
39 (39.00%)
2 (2.00%)
13 (13.00%)
28 (28.00%)
36 (36.00%)
21 (21.00%)
0 (0.00%)
5 (5.00%)
27 (27.00%)
42 (42.00%)
26 (26.00%)
5. 優れている
4. 良い
3. 普通
2. 悪い
1. とても悪い
Tags
All tags
model_1
model_2
model_3
model_4
model_5
model_6
20 (20.00%)
19 (19.00%)
21 (21.00%)
1 (1.00%)
2 (2.00%)
0 (0.00%)
Deep analysis
Distribution
Mean
Files
5. 優れている
4. 良い
3. 普通
2. 悪い
1. とても悪い
MAX 5
4
3
2
MIN 1
MAX 5
4
3
2
MIN 1
Models: All models
Tags: All tags
Filename
Model
Tags
Statistics
x̅
CI
σ
x̅
00:00
--:--
1/mixed/1.wav
model_1
mixed
Man
x̅
2.60
CI
0.68
σ
x̅
0.24
00:00
--:--
1/mixed/2.wav
model_1
mixed
Woman
x̅
3.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/mixed/3.wav
model_1
mixed
Man
x̅
3.40
CI
1.11
σ
x̅
0.40
00:00
--:--
1/mixed/4.wav
model_1
mixed
Woman
x̅
3.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/mixed/5.wav
model_1
mixed
Man
x̅
4.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/twister/6.wav
model_1
twister
Woman
x̅
4.00
CI
1.24
σ
x̅
0.45
00:00
--:--
1/twister/7.wav
model_1
twister
Man
x̅
2.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/twister/8.wav
model_1
twister
Woman
x̅
3.60
CI
1.42
σ
x̅
0.51
1
2
3
4
5
...
15
Question 2. この音声の感情表現はスクリプトの文脈にどの程度一致していますか?
Single select | Scored | 5 radio buttons
Overall
MAX 5
非常に一致している
4
一致している
3
まあまあ一致している
2
やや一致していない
MIN 1
全く一致していない
MAX 5
非常に一致している
4
一致している
3
まあまあ一致している
2
やや一致していない
MIN 1
全く一致していない
Models
By Tag
X-axis
Model
Tag
MAX 5
非常に一致している
4
一致している
3
まあまあ一致している
2
やや一致していない
MIN 1
全く一致していない
MAX 5
非常に一致している
4
一致している
3
まあまあ一致している
2
やや一致していない
MIN 1
全く一致していない
model_1
model_2
model_3
model_4
model_5
model_6
Tags
Answers
5. 非常に一致している
4. 一致している
3. まあまあ一致している
2. やや一致していない
1. 全く一致していない
model_1
model_2
model_3
model_4
model_5
model_6
19 (19.00%)
30 (30.00%)
34 (34.00%)
13 (13.00%)
4 (4.00%)
18 (18.00%)
32 (32.00%)
25 (25.00%)
20 (20.00%)
5 (5.00%)
18 (18.00%)
31 (31.00%)
30 (30.00%)
17 (17.00%)
4 (4.00%)
2 (2.00%)
14 (14.00%)
44 (44.00%)
25 (25.00%)
15 (15.00%)
6 (6.00%)
20 (20.00%)
33 (33.00%)
28 (28.00%)
13 (13.00%)
1 (1.00%)
14 (14.00%)
43 (43.00%)
28 (28.00%)
14 (14.00%)
5. 非常に一致している
4. 一致している
3. まあまあ一致している
2. やや一致していない
1. 全く一致していない
Tags
All tags
model_1
model_2
model_3
model_4
model_5
model_6
19 (19.00%)
18 (18.00%)
18 (18.00%)
2 (2.00%)
6 (6.00%)
1 (1.00%)
Deep analysis
Distribution
Mean
Files
5. 非常に一致している
4. 一致している
3. まあまあ一致している
2. やや一致していない
1. 全く一致していない
MAX 5
4
3
2
MIN 1
MAX 5
4
3
2
MIN 1
Models: All models
Tags: All tags
Filename
Model
Tags
Statistics
x̅
CI
σ
x̅
00:00
--:--
1/mixed/1.wav
model_1
mixed
Man
x̅
2.80
CI
0.56
σ
x̅
0.20
00:00
--:--
1/mixed/2.wav
model_1
mixed
Woman
x̅
3.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/mixed/3.wav
model_1
mixed
Man
x̅
2.80
CI
1.04
σ
x̅
0.37
00:00
--:--
1/mixed/4.wav
model_1
mixed
Woman
x̅
4.40
CI
0.68
σ
x̅
0.24
00:00
--:--
1/mixed/5.wav
model_1
mixed
Man
x̅
4.20
CI
1.04
σ
x̅
0.37
00:00
--:--
1/twister/6.wav
model_1
twister
Woman
x̅
3.60
CI
0.68
σ
x̅
0.24
00:00
--:--
1/twister/7.wav
model_1
twister
Man
x̅
2.80
CI
0.56
σ
x̅
0.20
00:00
--:--
1/twister/8.wav
model_1
twister
Woman
x̅
3.80
CI
1.62
σ
x̅
0.58
1
2
3
4
5
...
15
Question 3. 音声の品質に問題がある場合、どのような問題が当てはまりますか?(複数選択可)
Multiple select | No-scored | 4 checkboxes
Answers
A1. エコーや残響がある
A2. 背景ノイズや歪みがある
A3. 音声が途切れるまたはスキップする
A4. 速度やイントネーションが不適切
A5. 上記のいずれでもない
model_1
model_2
model_3
model_4
model_5
model_6
5 (4.55%)
5 (4.55%)
12 (10.91%)
44 (40.00%)
44 (40.00%)
2 (1.79%)
4 (3.57%)
12 (10.71%)
60 (53.57%)
34 (30.36%)
18 (16.07%)
11 (9.82%)
1 (0.89%)
49 (43.75%)
33 (29.46%)
18 (13.24%)
8 (5.88%)
14 (10.29%)
80 (58.82%)
16 (11.76%)
13 (10.08%)
4 (3.10%)
22 (17.05%)
75 (58.14%)
15 (11.63%)
30 (19.48%)
4 (2.60%)
32 (20.78%)
80 (51.95%)
8 (5.19%)
A1. エコーや残響がある
A2. 背景ノイズや歪みがある
A3. 音声が途切れるまたはスキップする
A4. 速度やイントネーションが不適切
A5. 上記のいずれでもない
Tags
All tags
model_1
model_2
model_3
model_4
model_5
model_6
5 (4.55%)
2 (1.79%)
18 (16.07%)
18 (13.24%)
13 (10.08%)
30 (19.48%)
Deep analysis
Distribution
Files
A1. エコーや残響がある
A2. 背景ノイズや歪みがある
A3. 音声が途切れるまたはスキップする
A4. 速度やイントネーションが不適切
A5. 上記のいずれでもない
Models: All models
Tags: All tags
Answers
エコーや残響がある
背景ノイズや歪みがある
音声が途切れるまたはスキップする
速度やイントネーションが不適切
上記のいずれでもない
Filename
Model
Tags
00:00
--:--
1/mixed/1.wav
model_1
mixed
Man
上記のいずれでもない
速度やイントネーションが不適切
00:00
--:--
1/mixed/2.wav
model_1
mixed
Woman
速度やイントネーションが不適切
上記のいずれでもない
00:00
--:--
1/mixed/4.wav
model_1
mixed
Woman
速度やイントネーションが不適切
背景ノイズや歪みがある
00:00
--:--
1/mixed/5.wav
model_1
mixed
Man
上記のいずれでもない
エコーや残響がある
背景ノイズや歪みがある
00:00
--:--
1/twister/6.wav
model_1
twister
Woman
上記のいずれでもない
速度やイントネーションが不適切
音声が途切れるまたはスキップする
00:00
--:--
1/twister/7.wav
model_1
twister
Man
音声が途切れるまたはスキップする
速度やイントネーションが不適切
背景ノイズや歪みがある
00:00
--:--
1/twister/8.wav
model_1
twister
Woman
上記のいずれでもない
速度やイントネーションが不適切
音声が途切れるまたはスキップする
00:00
--:--
1/twister/10.wav
model_1
twister
Woman
エコーや残響がある
速度やイントネーションが不適切
音声が途切れるまたはスキップする
1 more...
1
2
3
4
5
...
15