
Du 11 février au 2 mars 2004:
Comme prévu, j'ai terminé les procédures
d'apprentissage totalement, partiellement et non supervisé de la
méthode em_learning. Comme
heuristique de présélection des sens, j'ai simplement choisi de
prendre les sens dont la probabilité a posteriori est plus grande que
la moyenne de ces probabilités (i.e. un divisé par le nombre de sens
du mot), et ce individuellement pour chacun des mots de la fenêtre
sur le corpus. Une meilleure métrique pourra être développée
lorsqu'il sera temps de tester le modèle.
J'ai aussi terminé la procédure d'apprentissage sur
pseudo-données. Pour l'instant, elle consiste simplement à
considérer les sens "frères" dans la hiérarchie de
WordNet comme étant des co-occurrences de ces sens. Encore une fois,
si cette avenue semble prometteuse lors du test, j'envisagerai alors
de la développer.
Il semble donc que je sois en avance sur mon plan de
développement. Je peux maintenant m'attaquer au test et à l'analyse
du modèle graphique. J'aurai plus de temps pour raffiner certains
aspect du modèle et pour faire une analyse plus poussée des
résultats.
