这种错误通常是因为传递给DocumentTermMatrix()函数的参数类型不正确。DocumentTermMatrix()需要接受统计文档单词频率的输入类型。因此,必须将传入的文本转换为正确的格式。以下示例将解决此问题:
using TextAnalysis
# 将文本转换为包含单词计数的文档 - 词矩阵。
corpus = ["This is the first document.", "This is the second document.", "Third document. Document number three!", "Number four. To repeat, number four."]
tokens = [split(doc, " ") for doc in corpus]
dtm = DocumentTermMatrix(tokens)
在这个示例中,将文本转换为一个由单词计数组成的文档 - 词矩阵,解决了方法不匹配的问题。