开发Python的环境选择很多,windows、Linux、MacOs都可以,除了Windows需要在Python官网上下载安装包,并配置环境变量。在Linux和MacOs上都是自带Python的,关于Python的版本大多都是2.7.*
本文选择了Ubuntu环境来学习Python,主要原因是为了顺便熟悉Linux的环境与命令,开发工具选择的是Vim,当然更多其他的选择有Eclipse、Sublime、pycharm等等,根据个人喜好选择即可,
另:文章部分内容来自Imooc和51CTO,侵删。
作为开始我们先来个约定俗成的Hello World,打开终端,输入
python
python,进入python的交互式运行环境。
接着输入
print 'Hello World'
是不是很简单。
在Python中,能够直接处理的数据类型有以下几种:
Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。
基本的运算:
使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层:
和数学运算不同的地方是,Python的整数运算结果仍然是整数,浮点数运算结果仍然是浮点数:
但是整数和浮点数混合运算的结果就变成浮点数了:
为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如 0.1
换成二进制表示就是无限循环小数。
那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?我们来试一下:
令很多初学者惊讶的是,Python的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,Python提供了一个求余的运算 % 可以计算余数:
如果我们要计算 11 / 4 的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:
在Python中字符串可以用 ''
或者 ""
括起来表示。
如果字符串本身包含 '
怎么办?比如我们要表示字符串 I'm OK
,这时,可以用 " "
括起来表示:
类似的,如果字符串包含 "
,我们就可以用 ' '
括起来表示:
如果字符串既包含 '
又包含 "
怎么办?
这个时候,就需要对字符串的某些特殊字符进行“转义”,Python字符串用 /
进行转义。
要表示字符串 he said "I'm OK".
由于 ' 和 " 会引起歧义,因此,我们在它前面插入一个 /
表示这是一个普通字符,不代表字符串的起始,因此,这个字符串又可以表示为
注意:转义字符 / 不计入字符串的内容中。
常用的转义字符还有:
/n 表示换行 /t 表示一个制表符 // 表示 / 字符本身
如果一个字符串包含很多需要转义的字符,对每一个字符都进行转义会很麻烦。为了避免这种情况,我们可以在字符串前面加个前缀 r
,表示这是一个 raw 字符串,里面的字符就不需要转义了。比如
但是 r'...'
表示法不能表示多行字符串,也不能表示包含 '
和 "
的字符串,如果要表示多行字符串,可以用 '''...'''
表示:
字符串的拼接,在Python中字符串的拼接也是可以用占位符的,%s表示字符型%d表示数值型。
字符串还有一个编码问题。
因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。
如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。
类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。
因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。
Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示,比如:
当然也可以在文件头注释标识出编码格式,告诉python编译器采用哪种格式编译,顺便一提,在python中使用符号 # 表示注释,比如
我们已经了解了Python支持布尔类型的数据,布尔类型只有 True
和 False
两种值,但是布尔类型有以下几种运算:
注意区分大小写。
与运算:只有两个布尔值都为 True 时,计算结果才为 True。
或运算:只要有一个布尔值为 True,计算结果就是 True。
非运算:把True变为False,或者把False变为True:
布尔运算在计算机中用来做条件判断,根据计算结果为True或者False,计算机可以自动执行不同的后续代码。
在Python中,布尔类型还可以与其他数据类型做 and、or和not运算,请看下面的代码:
a = True print a and 'a=T' or 'a=F'
计算结果不是布尔类型,而是字符串 'a=T',这是为什么呢?
因为Python把 0
、 空字符串''
和 None
看成 False,其他数值和非空字符串都看成 True,所以:
True and 'a=T' 计算结果是 'a=T' 继续计算 'a=T' or 'a=F' 计算结果还是 'a=T'
1. 在计算 a and b
时,如果 a 是 False,则根据与运算法则,整个结果必定为 False,因此返回 a;如果 a 是 True,则整个计算结果必定取决与 b,因此返回 b。
2. 在计算 a or b
时,如果 a 是 True,则根据或运算法则,整个计算结果必定为 True,因此返回 a;如果 a 是 False,则整个计算结果必定取决于 b,因此返回 b。
所以Python解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。
在Python中变量的声明不需要关键字,因为Python是动态语言,与Java和C#这类静态语言不一样,直接输入变量名然后赋值即可。
如果从数学上理解x = x + 1那无论如何是不成立的,在程序中,赋值语句先计算右侧的表达式x + 1,得到结果2,再赋给变量x。由于x之前的值是1,重新赋值后,x的值变成2。
最后,理解变量在计算机内存中的表示也非常重要。当我们写: a = 'ABC'
时,Python解释器干了两件事情:
1. 在内存中创建了一个 'ABC'
的字符串;
2. 在内存中创建了一个名为 a
的变量,并把它指向 'ABC'
。
也可以把一个变量a赋值给另一个变量b,这个操作实际上是把变量b指向变量a所指向的数据,例如下面的代码:
最后一行打印出变量b的内容是'XYZ'如果从数学意义上理解,就会错误地得出b和a相同,也应该是'XYZ',但实际上b的值是'ABC',让我们一行一行地执行代码,就可以看到到底发生了什么事:
执行 a = 'ABC'
,解释器创建了字符串 'ABC'和变量 a,并把a指向 'ABC':
执行 b = a
,解释器创建了变量 b,并把b指向 a 指向的字符串'ABC':
执行 a = 'XYZ'
,解释器创建了字符串'XYZ',并把a的指向改为'XYZ',但b并没有更改:
所以,最后打印变量 b
的结果自然是 'ABC'
了。
Python内置的一种数据类型是列表: list
。
list是一种有序的集合,可以随时添加和删除其中的元素。
比如,列出班里所有同学的名字,就可以用一个list表示:
list是数学意义上的有序集合,也就是说,list中的元素是按照顺序排列的。
构造list非常简单,按照上面的代码,直接用 [ ]
把list的所有元素都括起来,就是一个list对象。通常,我们会把list赋值给一个变量,这样,就可以通过变量来引用list:
由于Python是动态语言,所以list中包含的元素并不要求都必须是同一种数据类型,我们完全可以在list中包含各种数据:
一个元素也没有的list,就是空list:
同其他语言的列表一样,也是支持下标索引的,正数为升序,负数为降序。
同样可以插入数据,append表示追加,即总是加入到列表的最后,insert可以根据需要插入到指定位置。
也可以删除,删除使用pop(),表示总是移除最后一个,也可以指定位置移除。
替换,指定下标的值赋值即可替换。
tuple 和 list 非常类似,但是,tuple一旦创建完毕,就不能修改了,完全只读,tuple没有 append()方法,也没有insert()和pop()方法。
创建tuple和创建list唯一不同之处是用 ( )
替代了 [ ]
。
同样是表示班里同学的名称,用tuple表示如下:
tuple和list一样,可以包含 0 个、1个和任意多个元素。
包含多个元素的 tuple,前面我们已经创建过了。
包含 0 个元素的 tuple,也就是空tuple,直接用 ()表示:
创建包含1个元素的 tuple 呢?来试试:
好像哪里不对!t 不是 tuple ,而是整数1。 为什么 呢?
因为 ()
既可以表示tuple,又可以作为括号表示运算时的优先级,结果 (1) 被Python解释器计算出结果 1,导致我们得到的不是tuple,而是整数 1。
正是因为用()定义单元素的tuple有歧义,所以 Python 规定,单元素 tuple 要多加一个逗号“,”,这样就避免了歧义:
Python在打印单元素tuple时,也自动添加了一个“,”,为了更明确地告诉你这是一个tuple。
多元素 tuple 加不加这个额外的“,”效果是一样的:
前面我们看到了tuple一旦创建就不能修改。现在,我们来看一个“可变”的tuple:
注意到 t 有 3 个元素: 'a','b' 和一个list: ['A', 'B'] 。list作为一个整体是tuple的第3个元素。list对象可以通过 t[2] 拿到:
然后,我们把list的两个元素改一改:
再看看tuple的内容:
不是说tuple一旦定义后就不可变了吗?怎么现在又变了?
别急,我们先看看定义的时候tuple包含的3个元素:
当我们把list的元素 'A'和'B' 修改为 'X'和'Y' 后,tuple变为:
表面上看,tuple的元素确实变了,但其实变的不是 tuple 的元素,而是list的元素。
tuple一开始指向的list并没有改成别的list,所以,tuple所谓的 “不变” 是说,tuple的每个元素,指向永远不变。即 指向'a',就不能改成指向'b' ,指向一个list,就不能改成指向其他对象,但指向的这个list本身是可变的!
理解了 “指向不变” 后,要创建一个内容也不变的tuple怎么做?那就必须保证tuple的每一个元素本身也不能变,比如讲上面的t[2]的list也改为tuple。