모델링 및 예측

토픽모델단어을사용하여예측개발개발

LSA, LDA, 단어 임베딩 같은 머신러닝 기법과 모델을 사용하여 고차원 텍스트 데이터셋에서 군집을 찾고 특징을 추출할 수 있습니다. Text Analytics Toolbox™에서 생성한 특징은 다른 데이터 소스의 특징과 결합할 수 있습니다. 결합된 특징을 사용하여 텍스트, 숫자 등 다양한 유형의 데이터를 활용하는 머신러닝 모델을 빌드할 수 있습니다.

함수

모두확장

단어및n-gram개수세기

`小词`	Bag-of-words 모델
`Bagofngrams`	n-grams모델
`addDocument`	词袋모델또는n-grams모델
`removeDocument`	词袋모델또는n-grams모델
`删除InfrequentWords`	bag-of-words 모델에서 개수가 적은 단어 제거
`removeInfrequentNgrams`	n-gram的袋모델에서빈도로나오는나오는n-gram제거
`删除字`	문서또는 bag-of-words 모델에서 선택한 단어 제거
`removengrams`	n-grams모델모델n-gram제거
`remove emptimentDocuments`	토큰화된 문서 배열, bag-of-words 모델 또는 bag-of-n-grams 모델에서 빈 문서 제거
`topkwords`	词袋模型或LDA主题中最重要的词语
`topkngrams`	最常见的n-gram
`编码`	n-gram개수로개수로개수로개수로구성된인코딩인코딩
`TFIDF`	TF-IDF(단어빈도-역문서빈)도행렬
`加入`	结合多个字袋或n-grams型号

감성 분석

`vaderSentimentScores`	Sentiment scores with VADER algorithm
`ratioSentimentScores`	Sentiment scores with ratio rule

단어 임베딩 및 인코딩

`fastTextWordEmbedding`	FastText단어단어단어임베딩임베딩
`文字编码`	단어를 인덱스로 매핑하는 단어 인코딩 모델
`doc2sequence`	将文档转换为深度学习的序列
`wordEmbeddingLayer`	딥러닝신경망위한단어임베딩계층
`word2vec`	단어를벡터에매핑하기
`word2ind`	단어를인덱스에매핑하기
`vec2word`	임베딩벡터를에매핑
`Ind2word`	인코딩인덱스단어에매핑하기
`isVocabularyWord`	단어가 단어 임베딩 또는 인코딩에 포함되었는지 테스트
`ReadWordEmbedding`	파일에서 단어 임베딩 읽어오기
`Trainwordembedding`	火车单词嵌入
`写入wordembedding`	단어 임베딩 파일 쓰기
`wordEmbedding`	단어를 벡터로 매핑하는 단어 임베딩 모델

문서요약및유사도

`提取物`	문서에서 요약 추출
`rakekeywords`	使用耙子提取关键字
`TextrankKeyWords`	使用Textrank提取关键字
`bleuEvaluationScore`	用BLEU相似性评分评估翻译或汇总
`rougeEvaluationScore`	Evaluate translation or summarization with ROUGE similarity score
`BM25相似性`	文档与BM25算法的相似性
`cosineSimilarity`	코사인유사도사용한문서유사도
`textrankScores`	TextRank 알고리즘을 사용하여 문서 점수화
`Lexrankscores`	lexrank알고리즘을하여문서화화
`mmrscores`	具有最大边际相关性（MMR）算法的文档评分

토픽모델링및축소

`fitlda`	拟合潜在的Dirichlet分配（LDA）模型
`fitlsa`	Fit LSA model
`恢复`	Resume fitting LDA model
`logp`	LDA模型的文档对数概率和拟合度的优点
`predict`	预测文档的顶级LDA主题
`transform`	Transform documents into lower-dimensional space
`ldamodel`	潜在的Dirichlet分配（LDA）模型
`lsaModel`	潜在语义分析（LSA）模型

시각화

`WordCloud`	创建文字云图表，单词袋型号，n-grams型号或LDA模型
`text -scatter`	2-D 텍스트 산점도 플롯
`TextScatter3`	3-D 텍스트 산점도 플롯

도움말 항목

분류및모델링

단순 전처리 함수 만들기
이예제분석텍스트데이터를하고전처리함수만드는방법을보여줍니다줍니다。
분류를 위한 간단한 텍스트 모델 만들기
tog的words fords모델모델사용단어수로간단텍스트텍스트분류기를훈련시키는방법을보여줍니다줍니다줍니다줍니다。
다단어구문사용하여텍스트하기하기
n-gram빈도빈도빈도를사용텍스트를하는을보여줍니다줍니다。
토픽 모델을 사용하여 텍스트 데이터 분석하기
lda（잠재할당）토픽토픽모델하여데이터를하는방법을줍니다줍니다줍니다줍니다줍니다줍니다。
LDA 모델의 토픽 수 선택하기
이 예제에서는 LDA(잠재 디리클레 할당) 모델에 적합한 토픽 수를 결정하는 방법을 보여줍니다.
比较LDA求解器
此示例显示了如何通过比较拟合度的优点和适合模型所花费的时间来比较潜在的dirichlet分配（LDA）求解器。
Visualize Document Clusters Using LDA Model
This example shows how to visualize the clustering of documents using a Latent Dirichlet Allocation (LDA) topic model and a t-SNE plot.
可视化LDA主题相关性
此示例显示了如何在潜在的Dirichlet分配（LDA）主题模型中分析主题之间的相关性。
可视化LDA主题与文档标签之间的相关性
This example shows how to fit a Latent Dirichlet Allocation (LDA) topic model and visualize correlations between the LDA topics and document labels.
동시발생 신경망 만들기
tog的words fords모델모델을동시신경망을방법을보여줍니다줍니다줍니다줍니다。

감성분석및추출

텍스트에 내포된 감성 분석하기
Vader（Valence Aware Away词典和情感推理者）알고리즘알고리즘을감성을하는방법보여줍니다줍니다줍니다줍니다줍니다줍니다
产生域特异性情感词典
此示例显示了如何使用10-K和10-Q财务报告生成词典来进行情感分析。
감성 분류기 훈련시키기
이예제주석있는긍정적적적적단어목록사전훈련훈련단어단어임베딩을을사용하여분류기분류기에게감성감성감성분석분석분석을을훈련훈련시키는방법을
Extract Keywords from Text Data Using RAKE
This example shows how to extract keywords from text data using Rapid Automatic Keyword Extraction (RAKE).
使用Textrank从文本数据中提取关键字
This example shows to extract keywords from text data using TextRank.

딥러닝

딥러닝을하여텍스트데이터하기하기
이예제딥러닝（LSTM）신경망신경망하여데이터를하는방법을보여줍니다줍니다줍니다。
使用卷积神经网络对文本数据进行分类
This example shows how to classify text data using a convolutional neural network.
使用深度学习对失调的文本数据进行分类
此示例显示了如何使用转换后的数据存储使用深度学习网络将失调的文本数据分类。
Sequence-to-Sequence Translation Using Attention
This example shows how to convert decimal strings to Roman numerals using a recurrent sequence-to-sequence encoder-decoder model with attention.
使用深度学习的多标签文本分类
This example shows how to classify text data that has multiple independent labels.
딥러닝을 사용하여 텍스트 생성하기（深度学习工具箱）
이예제텍스트생성（LSTM）신경망신경망을훈련훈련시키는방법줍니다줍니다줍니다。
오만과 편견 그리고 MATLAB
lastm신경망딥러닝딥러닝하도록하도록하여신경망신경망신경망신경망신경망신경망을훈련훈련시키는방법방법을보여보여줍니다줍니다。
使用深度学习的逐字文字生成
此示例显示了如何训练深度学习LSTM网络以生成单词的文字。
使用自定义培训循环对文本数据进行分类
This example shows how to classify text data using a deep learning bidirectional long short-term memory (BiLSTM) network with a custom training loop.
Generate Text Using Autoencoders
此示例显示了如何使用自动编码器生成文本数据。
Define Text Encoder Model Function
This example shows how to define a text encoder model function.
텍스트 디코더 모델 함수 정의하기
이 예제에서는 텍스트 디코더 모델 함수를 정의하는 방법을 보여줍니다.
使用深度学习的语言翻译
此示例显示了如何使用重复的序列到序列编码器模型来训练德语到英语翻译器。

언어지원

언어고려사항
text Analytics工具箱text Analytics기능기능사용에정보정보정보정보。
일본어 지원
文本分析工具箱의의대한정보정보。
分析日本文本数据
This example shows how to import, prepare, and analyze Japanese text data using a topic model.
German Language Support
Information on German support in Text Analytics Toolbox.
分析德语文本数据
This example shows how to import, prepare, and analyze German text data using a topic model.