Je l'ai dit moi-même, ces indices ont assez peu d'intérêt (du moins ce sont des grands classiques de l'analyse textuelle). Néanmoins, ils n'ont jamais été appliqués à des livres-jeux : la montagne interdite contient de nombreux mots qui lui sont propres, notamment des noms de sorts, qui pouvaient modifier la donne.
Par ailleurs, le programme peut toujours intéresser des auteurs curieux et amateurs de statistiques.
A la limite je vais peut-être appliquer le programme sur toutes les AVHs du yaz 2012, pour le fun...
C'est fait, voici quelques stats concernant les AVHs du Yaz 2013. Les valeurs intéressantes sont évidemment les valeurs relatives (remarque sur le vocabulaire employé : "occurrences" est le nombre de mots total, "formes" donne le nombre de mots différents et hapax le nombre de mots "rares", cad apparaissant une seule fois dans le texte), puisqu'on peut ensuite les comparer. On observe que les valeurs de Quand souffle la tempête sont nettement inférieures aux deux autres AVH primées : sa variété moyenne des mots ne l'a pas empêchée d'être bien écrite, et surtout d'être originale. On remarque qu'Emergence s'en tire pas mal aussi, mais cela est sans doute dû en partie au fait que j'ai dû utiliser un vocabulaire particulier : celui des fourmis.
Enfin, il faut aussi se souvenir que plus une AVH est longue, plus le nombre de formes et d'hapax aura tendance à ralentir, d'où la relative faiblesse des scores relatifs des Trois villages et de l'Ecume des temps. A contrario, plus l'AVH est courte, plus les formes et les hapax relatifs seront élevés (j'ai eu 23% et 14% pour chienlit sur chienlit, qui ne fait que 50§ et 17000 mots, et on a 21% et 12% pour les gemmes de l'infinie, qui ne fait que 10000 mots).
Quand souffle la tempête
**********Richesse de vocabulaire**************
occurences : 32436
formes : 4036
hapax : 1653
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 12.442965
hapax : 5.096189
Les noyés
**********Richesse de vocabulaire**************
occurences : 25318
formes : 4473
hapax : 2490
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 17.667272
hapax : 9.834900
Chrysalide
**********Richesse de vocabulaire**************
occurences : 24112
formes : 3979
hapax : 2270
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 16.502157
hapax : 9.414399
Trois villages
**********Richesse de vocabulaire**************
occurences : 76063
formes : 8284
hapax : 4216
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 10.890972
hapax : 5.542774
Emergence
**********Richesse de vocabulaire**************
occurences : 26198
formes : 4204
hapax : 2292
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 16.047026
hapax : 8.748759
Ecume des temps
**********Richesse de vocabulaire**************
occurences : 76672
formes : 9013
hapax : 4831
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 11.755269
hapax : 6.300866
Ombre du phénix
**********Richesse de vocabulaire**************
occurences : 77184
formes : 7402
hapax : 3418
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 9.590070
hapax : 4.428379
Dans les Montagnes de Sifflemort
**********Richesse de vocabulaire**************
occurences : 30316
formes : 4387
hapax : 2300
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 14.470906
hapax : 7.586753
Les gemmes de l'infini
**********Richesse de vocabulaire**************
occurences : 9572
formes : 2039
hapax : 1226
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 21.301713
hapax : 12.808191
Par ailleurs, le programme peut toujours intéresser des auteurs curieux et amateurs de statistiques.
A la limite je vais peut-être appliquer le programme sur toutes les AVHs du yaz 2012, pour le fun...
C'est fait, voici quelques stats concernant les AVHs du Yaz 2013. Les valeurs intéressantes sont évidemment les valeurs relatives (remarque sur le vocabulaire employé : "occurrences" est le nombre de mots total, "formes" donne le nombre de mots différents et hapax le nombre de mots "rares", cad apparaissant une seule fois dans le texte), puisqu'on peut ensuite les comparer. On observe que les valeurs de Quand souffle la tempête sont nettement inférieures aux deux autres AVH primées : sa variété moyenne des mots ne l'a pas empêchée d'être bien écrite, et surtout d'être originale. On remarque qu'Emergence s'en tire pas mal aussi, mais cela est sans doute dû en partie au fait que j'ai dû utiliser un vocabulaire particulier : celui des fourmis.
Enfin, il faut aussi se souvenir que plus une AVH est longue, plus le nombre de formes et d'hapax aura tendance à ralentir, d'où la relative faiblesse des scores relatifs des Trois villages et de l'Ecume des temps. A contrario, plus l'AVH est courte, plus les formes et les hapax relatifs seront élevés (j'ai eu 23% et 14% pour chienlit sur chienlit, qui ne fait que 50§ et 17000 mots, et on a 21% et 12% pour les gemmes de l'infinie, qui ne fait que 10000 mots).
Quand souffle la tempête
**********Richesse de vocabulaire**************
occurences : 32436
formes : 4036
hapax : 1653
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 12.442965
hapax : 5.096189
Les noyés
**********Richesse de vocabulaire**************
occurences : 25318
formes : 4473
hapax : 2490
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 17.667272
hapax : 9.834900
Chrysalide
**********Richesse de vocabulaire**************
occurences : 24112
formes : 3979
hapax : 2270
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 16.502157
hapax : 9.414399
Trois villages
**********Richesse de vocabulaire**************
occurences : 76063
formes : 8284
hapax : 4216
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 10.890972
hapax : 5.542774
Emergence
**********Richesse de vocabulaire**************
occurences : 26198
formes : 4204
hapax : 2292
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 16.047026
hapax : 8.748759
Ecume des temps
**********Richesse de vocabulaire**************
occurences : 76672
formes : 9013
hapax : 4831
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 11.755269
hapax : 6.300866
Ombre du phénix
**********Richesse de vocabulaire**************
occurences : 77184
formes : 7402
hapax : 3418
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 9.590070
hapax : 4.428379
Dans les Montagnes de Sifflemort
**********Richesse de vocabulaire**************
occurences : 30316
formes : 4387
hapax : 2300
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 14.470906
hapax : 7.586753
Les gemmes de l'infini
**********Richesse de vocabulaire**************
occurences : 9572
formes : 2039
hapax : 1226
**********Richesse de vocabulaire rapportée au nombre d'occurences **************
formes : 21.301713
hapax : 12.808191