Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

모델링 및 예측

토픽 모델과 단어 임베딩을 사용하여 예측 모델 개발

LSA, LDA, 단어 임베딩 같은 머신러닝 기법과 모델을 사용하여 고차원 텍스트 데이터셋에서 군집을 찾고 특징을 추출할 수 있습니다. Text Analytics Toolbox™에서 생성한 특징은 다른 데이터 소스의 특징과 결합할 수 있습니다. 결합된 특징을 사용하여 텍스트, 숫자 등 다양한 유형의 데이터를 활용하는 머신러닝 모델을 빌드할 수 있습니다.

함수

모두 확장

bagOfWords Bag-of-words 모델
bagOfNgrams Bag-of-n-grams 모델
addDocument bag-of-words 모델 또는 bag-of-n-grams 모델에 문서 추가
removeDocument bag-of-words 모델 또는 bag-of-n-grams 모델에서 문서 제거
removeInfrequentWords bag-of-words 모델에서 개수가 적은 단어 제거
removeInfrequentNgrams bag-of-n-grams 모델에서 낮은 빈도로 나오는 n-gram 제거
removeWords 문서 또는 bag-of-words 모델에서 선택한 단어 제거
removeNgrams bag-of-n-grams 모델에서 n-gram 제거
removeEmptyDocuments 토큰화된 문서 배열, bag-of-words 모델 또는 bag-of-n-grams 모델에서 빈 문서 제거
topkwords Most important words in bag-of-words model or LDA topic
topkngrams Most frequent n-grams
encode 문서를 단어 개수 또는 n-gram 개수로 구성된 행렬로 인코딩
tfidf TF-IDF(단어빈도-역문서빈)도행렬
加入 Combine multiple bag-of-words or bag-of-n-grams models
vaderSentimentScores Sentiment scores with VADER algorithm
ratioSentimentScores Sentiment scores with ratio rule
fastTextWordEmbedding 사전 훈련된 fastText 단어 임베딩
wordEncoding 단어를 인덱스로 매핑하는 단어 인코딩 모델
doc2sequence Convert documents to sequences for deep learning
wordEmbeddingLayer 딥러닝 신경망을 위한 단어 임베딩 계층
word2vec 단어를 임베딩 벡터에 매핑하기
word2ind 단어를 인코딩 인덱스에 매핑하기
vec2word 임베딩 벡터를 단어에 매핑
ind2word 인코딩 인덱스를 단어에 매핑하기
isVocabularyWord 단어가 단어 임베딩 또는 인코딩에 포함되었는지 테스트
readWordEmbedding 파일에서 단어 임베딩 읽어오기
trainWordEmbedding Train word embedding
writeWordEmbedding 단어 임베딩 파일 쓰기
wordEmbedding 단어를 벡터로 매핑하는 단어 임베딩 모델
extractSummary 문서에서 요약 추출
rakeKeywords Extract keywords using RAKE
textrankKeywords Extract keywords using TextRank
bleuEvaluationScore Evaluate translation or summarization with BLEU similarity score
rougeEvaluationScore Evaluate translation or summarization with ROUGE similarity score
bm25Similarity Document similarities with BM25 algorithm
cosineSimilarity 코사인 유사도를 사용한 문서 유사도
textrankScores TextRank 알고리즘을 사용하여 문서 점수화
lexrankScores LexRank 알고리즘을 사용하여 문서 점수화
mmrScores Document scoring with Maximal Marginal Relevance (MMR) algorithm
fitlda Fit latent Dirichlet allocation (LDA) model
fitlsa Fit LSA model
resume Resume fitting LDA model
logp Document log-probabilities and goodness of fit of LDA model
predict Predict top LDA topics of documents
transform Transform documents into lower-dimensional space
ldaModel Latent Dirichlet allocation (LDA) model
lsaModel Latent semantic analysis (LSA) model
wordcloud Create word cloud chart from text, bag-of-words model, bag-of-n-grams model, or LDA model
textscatter 2-D 텍스트 산점도 플롯
textscatter3 3-D 텍스트 산점도 플롯

도움말 항목

분류 및 모델링

감성 분석 및 키워드 추출

딥러닝

언어 지원