首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
01python专题
python 网络编程基础_01python 网络编程基础(python网络编程)
什么是IP地址? IP地址是指互联网协议地址 是IP adress的缩写 IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。 IP地址是一个32位的二进制数,通常被分割成4个8位2进制(4个字节)IP地址通常用“点分十进制”表示成(a.b.c.d)的形式,其中,a,b,c,d都是0~255之间的十进制整数。例:点分十进I
阅读更多...
唐|01python数据分析与机器学习|26使用Gensim库构造中文维基百科数据词向量模型
gensim的使用 from gensim.models import word2vec #掉包 sentences = [s.split() for s in raw_sentences] #分词 model = word2vec.Word2Vec(sentences,min_count=1) #引包 min_c
阅读更多...
唐|01python数据分析与机器学习|25自然语言处理词向量模型-word2vec
语言模型:机器翻译、拼写纠错(基于概率值的语言模型) N-gram模型 词向量 one-hot(无意义) word2vec 神经网络模型 多一个投影层:(n-1)*m首尾拼接起来的大向量 基于神经网络模型求解词向量
阅读更多...
唐|01python数据分析与机器学习实战|视频课程|文本分析
1.文本分析与关键字 停用词-----哈工大停用词表 Tf-idf-----关键词提取(词频,逆文档频率) TF-IDF=词频(TF)*逆文档频率(IDF) 相似度 (去除重复、停用词)句子----分词-----语料库------词频向量------余弦相似度 文本向量化的表示:类one-hot,ngram_range,TF-idf
阅读更多...