J'avais oublié de le préciser dans mon commentaire global, mais on observe qu'Oorgan obtient un très bon score (sans biais contrairement aux Gemmes, car son nombre de mots est suffisant), pour une AVH qui est pourtant arrivée avant-dernière. Cela confirme les retours qu'il a eu sur ses énormes progrès niveau style, qui contrastent avec son classement : avec un scénario plus étoffé, il pourrait faire des étincelles au prochain Yaz.
Analyse textuelle des oeuvres
|
05/03/2013, 04:37
Excellent article sur ce thème : http://sciencetonnante.wordpress.com/2013/02/04/pourquoi-moby-dick-est-un-livre-exceptionnel-et-autres-enseignements-de-la-litterature-numerique/
сыграем !
05/03/2013, 09:56
Très intéressant
Ca serait marrant de faire la même étude sur les LDVELH de Livingstone.
05/03/2013, 10:14
Du coup chacun a une sorte "d'indicateur de progrès" en ce qui concerne la richesse du vocabulaire.
Après il faut bien voir que dans ce type de classement c'est le dictionnaire qui arriverait en tête, or ce n'est pas franchement le bouquin le plus immersif! Tout ça pour dire que si la nature des mots est importante, leur agencement l'est tout autant. Mais ce dernier point doit être pratiquement impossible à modéliser, donc les "formes" et "hapax" sont sans doute bien les meilleurs indicateurs disponibles pour estimer la "qualité" d'un texte. +1 pour un comparatif entre auteurs pro (Livingstone&Cie^^)
05/03/2013, 11:06
(Modification du message : 05/03/2013, 11:08 par ashimbabbar.)
oui mais pour Livingstone et consorts, on devrait comparer les traductions. Est-ce que c'est pertinent ?
Enfin on peut le soutenir dans la mesure où c'est la version que nous avons connu et qui nous a formés… Si on prend la VO, on compare des textes en deux langues différentes et ça ne va plus du tout…
" Ashimbabbar m'a donné une dague et une épée et m'a dit
: Transperces-en ton corps; elles furent forgées pour toi." Poème d'Enheduanna
05/03/2013, 11:38
Si vous m'envoyez les bouquins au format numérique, je peux calculer les valeurs.
Je pourrai aussi calculer les valeurs seulement sur les 30 000 premiers mots des textes, afin de pouvoir comparer sans aucun biais les oeuvres avec les AVHs de petites taille qu'on a eu au yaz.
05/03/2013, 13:11
C'est très intéressant comme calcul!
Une question pour pousser le procédé dans ses limites (ou pas) : est-ce que si un texte est truffé de fautes, il en ressortira un grand nombre de formes (multiplication d'un même mot par 2 ou 3 orthographes erronées différentes) et d'hapax (une faute qui n'apparaît qu'à un endroit sera-t-elle considérée comme un mot unique) ?
05/03/2013, 13:18
Actuellement le programme ne gère même pas les pluriels, donc encore moins les fautes. On peut juste espérer qu'en moyenne, vu que tous les textes sont traités de la même manière, on retombe sur nos pattes.
|
« Sujet précédent | Sujet suivant »
|
Utilisateur(s) parcourant ce sujet : 11 visiteur(s)