对于英文语料,我们想要获得句子时,可以通过正则或者NLTK工具切分。例如,NLTK: from nltk.tokenize import sent_tokenizedocument=''sentences=sent_tokenize(document) NLTK会根据“.?!”等符号切分。但是当句子中含有缩写词时,可能会产生错误的切分: sent_tokenize('fight among
题目描述 题目描述 在数据分析时,我们可能需要将一句话分割成一个个单词,从而分析句子所包含的内容。编写一个程序,输入一句话,然后以空格为分界符将句子分割成一个个单词,最后将这些单词以列表形式输出。 输入描述 输入一个句子。 输出描述 程序将输入句子分割成单词,并以列表形式输出。 示例 示例 ① I love you 输出: ['I', 'love', 'you']