Frage Python-Schnittstelle zu ARPA-Dateien


Ich suche nach einer Python-Schnittstelle, um ARPA-Dateien (Back-Off-Sprachmodelle) zu laden und sie zu verwenden, um etwas Text auszuwerten, z.B. erhalte seine Log-Wahrscheinlichkeit, Perplexität usw.

Ich brauche die ARPA-Datei nicht in Python zu erzeugen, sondern nur zur Abfrage.

Hat jemand ein empfohlenes Paket? Ich habe schon gesehen kenlm und swig-srilm, aber das erste ist in Windows sehr schwer einzurichten und das zweite scheint nicht mehr gepflegt zu sein.


9
2018-05-26 04:05


Ursprung


Antworten:


Ich fand ein nettes Unterentwicklungspaket namens pynlpl was genau das tut, was ich brauche, mit sehr wenigen Abhängigkeiten (libxml2 ist ungefähr genug), und es gibt ARPA-Dateien eine reine Python-Implementierung


5
2018-06-13 13:17



Was ist mit dem ARPA-Paket?

Es ist ziemlich leicht. Seine APIs sind auch sehr intuitiv und leicht zu erlernen. Obwohl es nicht so schnell ist wie Kenlm, möchtest du es vielleicht trotzdem versuchen.

https://pypi.org/project/arpa/


1
2018-06-05 07:11