python自动化测试人工智能 - python
python计算机视觉深度学习3图像分类基础
什么是图像分类?
图像分类的核心任务是从预定义的一类图像中为图像分配标签。分析输入图像并返回标签对图像进行分类。标签始终来自一组预定义的可能类别。
比如预定义的标签为:
categories = {cat, dog, panda}

分类系统还可以通过概率为图像分配多个标签。比如狗:95%;猫:4%;熊猫:1%。更重要的是,W×H像素输入图像有三个通道,Red,Green和Blue,分析W×H×3 = N像素图像,并弄清楚如何正确分类图像的内容。

在图像分类中,我们的数据集是图像的集合。因此,每个图像都是数据点。

左边猫,右边狗,电脑看到的是像素矩阵。实际上,计算机并不知道图像中有动物。

上图可描述如下: •空间:天空位于图像的顶部,沙/海洋位于底部。 •颜色:天空是深蓝色,海水浅蓝色,而沙子则是 棕褐色。 •纹理:天空具有相对均匀的图案,而沙子非常粗糙。
需要应用特征提取来量化图像的内容 …
python计算机视觉深度学习工具2图像基础
构建自己的图像分类器之前需要了解图像是什么。
像素:图像的元素
像素是图像的基本元素。每个图像都由一组像素组成。没有比像素更细的粒度。
通常像素是光的“颜色”或“强度”。
下图的分辨率为1,000×750,这意味着它是1,000像素宽750像素高。我们可以将图像概念化为(多维)矩阵。图片中总共有1,000×750 = 750,000像素。

大多数像素以两种方式表示: 1.灰度/单通道 2.颜色
在灰度图像中,每个像素是0到255之间的标量值,其中零对应为“黑色”,255为“白色”。

彩色像素通常在RGB颜色空间中表示(其他颜色空间通常要转成RGB)。

黑色:(0, 0, 0) 红色:(255, 0, 0)
RGB色彩空间的主要缺点包括: •不使用“颜色选择器”工具时表示颜色不直观 …
python计算机视觉深度学习1简介
神经网络和深度学习简史
人工神经网络(ANN Artificial Neural Network)是一类学习的机器学习算法,它专注于模式识别,对数据进行学习,灵感来自大脑的结构和功能深度学习属于ANN算法的家族,在大多数情况下,两者可以互换使用。
事实上,你可能会惊讶地发现深度学习领域已经存在了60多年。自20世纪40年代以来,“深度学习”一直存在着各种各样的名字 变化,包括控制论,连接主义和最熟悉的人工神经网络。

第一个神经网络模型来自McCulloch和Pitts,1943年。这个网络是一个二元分类器,能够根据一些输入识别两个不同的类别。
然后,在20世纪50年代,开创性的Perceptron算法由Rosenblatt发表 - 这个模型可以自动学习输入分类所需的权重(无人为干预需要)。这个自动训练程序构成了随机梯度下降(SGD Stochastic Gradient Descent)的基础,今天仍用于训练非常深的神经网络。

在此期间,基于感知器的技术在神经网络社区中风靡一时。然而,Minsky和Papert 在1969年出版的一本书有效地停滞了神经 网络研究近十年。他们的工作证明了具有线性的感知器激活函数 …
python计算机视觉深度学习
pandas试题与技巧
删除包含某个值的行
现有df = pd.DataFrame([[1,0,2],[1,2,3],[0,1,2],[4,5,6]]),请删除其中包含0的行。
参考答案:
>>> import pandas as pd >>> df = pd.DataFrame([[1,0,2],[1,2,3],[0,1,2],[4,5,6]]) >>> df 0 1 2 0 1 0 …
Python自然语言工具库NLTK快速入门教程1简介
什么是自然语言处理?
自然语言处理是指通过软件或机器理解并操作文本或语音。 人类互动,了解彼此的观点,并用适当的答案作出回应。 在NLP中,这种交互,理解,响应是由计算机而不是人类完成的。
什么是NLTK?
NLTK代表Natural Language Toolkit。它包使计算机理解人类语言并使用适当的响应回复它。 本教程中将讨论标记,粉刺,词形还原,标点,字符计数,字数统计等。
自然语言库介绍
- NLTK 最有用,且是是所有NLP库中的鼻祖。
- spaCy 这是完全优化和高度准确的库,广泛用于深度学习
- Stanford CoreNLP Python 基于C-S的体系结构,用JAVA编写的,但它提供了在Python API
- TextBlob 处理文本数据,主要以API的形式提供所有类型的操作。
- Gensim 强大、非常高效且可扩展。
- Pattern 个轻量级NLP模块。 这通常用于Web挖掘,爬虫 …
最流行的开源数据分析,处理和可视化工具pandas的未来
pandas是一个功能强大的开源Python库,用于数据分析,处理和可视化,当前版本:0.23.4。用户在1000万左右,并成为Python数据科学工具包中的“必须使用”的工具。
许多数据科学家都向我提出过这样的问题:
pandas 可靠吗?
以后还会维护么?
为什么没有发布1.0版本!
版本号可用于表示产品的成熟度。但在开源世界中,版本号并不一定能告诉关于库的成熟度或可靠性的信息。 实际上 pandas既成熟又可靠!不过版本号传达了API的稳定性。
走向pandas 1.0
- 推荐使用方法链
不使用方法链的例子:
import pandas df = pandas.read_csv('data/titanic.csv.gz …
2019 最佳自然语言工具书籍下载
Natural Language Processing with TensorFlow - 2018.pdf

https://github.com/PacktPublishing/Natural-Language-Processing-with-TensorFlow
Mastering Natural Language Processing with Python - 2016.pdf

斯坦福权威教程 Speech and Language Processing (3rd edition in making) - Dan Jurafsky, James H. Martin 可在线下载
适合人群:初级到中级学者
推荐指数:★★★★★
主要内容:本书内容涵盖了自然语言处理的方方面面,从底层的词法分词、语法分析和语义分析,到和应用更为接近的自然语言处理任务,如信息抽取、机器翻译、自动问答、文本摘要、对话系统等 …
python标准模块介绍-性能测试工具boom
boom简介
boom是python替代ab的模块,并增加了部分功能。
boom安装
ubuntu 执行“pip install boom“即可,注意可能需要先执行"apt-get install libevent python-dev"。它使用Gevent创建虚拟用户,使用Requests发送请求。
boom快速入门
# boom -n1000 -c10 http://localhost /usr/local/anaconda3/lib/python3.6/site-packages/boom/boom.py:28: MonkeyPatchWarning: Monkey-patching ssl after ssl has already been imported may lead to errors, including RecursionError on …python数据分析工具pandas作业:把多行合并成一行
python数据分析工具pandas作业:合并excel重复行
数据示例:

转换成:

代码
#!/usr/bin/python3 # -*- coding: utf-8 -*- # 技术支持:https://www.jianshu.com/u/69f40328d4f0 # 技术支持 https://china-testing.github.io/merge_excel_rows.html # https://github.com/china-testing/python-api-tesing/blob/master/practices/pandas/merge_excel_rows2.py # 项目实战讨论QQ群630011153 144081101 # CreateDate: 2018-12-06 import pandas as pd df …