n-gramas

Cree modelos lingüísticos multipalabra y analícelos con机器学习

Un n-grama Un n- conjunto de n元素连续的Un文件,que puede incluir palabras, números, símbolos y puntuación。我们的模型útiles我们的理论análisis我们的理论análisis我们的理论clasificación我们的理论generación我们的理论。El modelado de n-gramas es una de las técnicas利用zadas para convertir texto de un formato无结构结构一个unformato结构。Una alternativa al n-gram es el uso de técnicas de word embedding, comoword2vec

比如

这是一个模型lingüístico que合并n-gramas contando la悬臂de veces que cada n-grama único aparece en un document。我是说,我是说,我是说,我是说。En MATLAB, se puede crear un modelo de bolsa de n-gramas utilzando una función "bagOfNgrams”

Nube de palabras de n-gramas donde n=2。Esta nube de palabras muestra las palabras más relevantes en naranja, como“机械臂”(brazo robótico) y“建筑代理人”(agent de construcción), y意甲palabras menos relevantes en negro que las rodean y tienen un tamaño menor。

Nube de palabras de n-gramas con n=2 (bigramas)。

Una vez creado, el modelo lingüístico se puede utizar con算法de机器学习对预测模型对应用程序de análisis文本。Para obtener más información清醒的拉丁文和拉丁文creación de modelos con datos textuales, consulte文本分析工具箱MATLAB监狱®



También puede consultar estos temas:自然的过程Análisis情感word2vecminería de textos con MATLAB数据科学深度学习深度学习工具箱™预测性维护工具箱™