转载

Linux下Python学习笔记 1:数据类型

一、开发环境

开发Python的环境选择很多,windows、Linux、MacOs都可以,除了Windows需要在Python官网上下载安装包,并配置环境变量。在Linux和MacOs上都是自带Python的,关于Python的版本大多都是2.7.*

本文选择了Ubuntu环境来学习Python,主要原因是为了顺便熟悉Linux的环境与命令,开发工具选择的是Vim,当然更多其他的选择有Eclipse、Sublime、pycharm等等,根据个人喜好选择即可,

另:文章部分内容来自Imooc和51CTO,侵删。

二、Hello World

作为开始我们先来个约定俗成的Hello World,打开终端,输入

python

python,进入python的交互式运行环境。

Linux下Python学习笔记 1:数据类型

接着输入

print 'Hello World'

Linux下Python学习笔记 1:数据类型

是不是很简单。

三、数据类型

在Python中,能够直接处理的数据类型有以下几种:

1:整数

Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。

基本的运算:

Linux下Python学习笔记 1:数据类型

使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层:

2:浮点数

和数学运算不同的地方是,Python的整数运算结果仍然是整数,浮点数运算结果仍然是浮点数:

但是整数和浮点数混合运算的结果就变成浮点数了:

为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如 0.1 换成二进制表示就是无限循环小数。

那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?我们来试一下:

令很多初学者惊讶的是,Python的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,Python提供了一个求余的运算 % 可以计算余数:

如果我们要计算 11 / 4 的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:

3:字符串

在Python中字符串可以用 '' 或者 "" 括起来表示。

如果字符串本身包含 ' 怎么办?比如我们要表示字符串 I'm OK ,这时,可以用 " " 括起来表示:

Linux下Python学习笔记 1:数据类型

类似的,如果字符串包含 " ,我们就可以用 ' ' 括起来表示:

Linux下Python学习笔记 1:数据类型

如果字符串既包含 ' 又包含 " 怎么办?

这个时候,就需要对字符串的某些特殊字符进行“转义”,Python字符串用 / 进行转义。

要表示字符串 he said "I'm OK".

由于 ' 和 " 会引起歧义,因此,我们在它前面插入一个 / 表示这是一个普通字符,不代表字符串的起始,因此,这个字符串又可以表示为

Linux下Python学习笔记 1:数据类型

注意:转义字符 / 不计入字符串的内容中。

常用的转义字符还有:

/n 表示换行 /t 表示一个制表符 // 表示 / 字符本身

如果一个字符串包含很多需要转义的字符,对每一个字符都进行转义会很麻烦。为了避免这种情况,我们可以在字符串前面加个前缀 r ,表示这是一个 raw 字符串,里面的字符就不需要转义了。比如

但是 r'...' 表示法不能表示多行字符串,也不能表示包含 '" 的字符串,如果要表示多行字符串,可以用 '''...''' 表示:

Linux下Python学习笔记 1:数据类型

字符串的拼接,在Python中字符串的拼接也是可以用占位符的,%s表示字符型%d表示数值型。

字符串还有一个编码问题。

因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。

如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。

类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。

Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。

因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。

Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示,比如:

Linux下Python学习笔记 1:数据类型

当然也可以在文件头注释标识出编码格式,告诉python编译器采用哪种格式编译,顺便一提,在python中使用符号 # 表示注释,比如

Linux下Python学习笔记 1:数据类型

4:布尔值

我们已经了解了Python支持布尔类型的数据,布尔类型只有 TrueFalse 两种值,但是布尔类型有以下几种运算:

注意区分大小写。

与运算:只有两个布尔值都为 True 时,计算结果才为 True。

或运算:只要有一个布尔值为 True,计算结果就是 True。

非运算:把True变为False,或者把False变为True:

布尔运算在计算机中用来做条件判断,根据计算结果为True或者False,计算机可以自动执行不同的后续代码。

在Python中,布尔类型还可以与其他数据类型做 and、or和not运算,请看下面的代码:

a = True print a and 'a=T' or 'a=F'

计算结果不是布尔类型,而是字符串 'a=T',这是为什么呢?

因为Python把 0空字符串''None 看成 False,其他数值和非空字符串都看成 True,所以:

True and 'a=T' 计算结果是 'a=T' 继续计算 'a=T' or 'a=F' 计算结果还是 'a=T'

要解释上述结果,又涉及到 and 和 or 运算的一条重要法则:短路计算。

1. 在计算 a and b 时,如果 a 是 False,则根据与运算法则,整个结果必定为 False,因此返回 a;如果 a 是 True,则整个计算结果必定取决与 b,因此返回 b。

2. 在计算 a or b 时,如果 a 是 True,则根据或运算法则,整个计算结果必定为 True,因此返回 a;如果 a 是 False,则整个计算结果必定取决于 b,因此返回 b。

所以Python解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。

四、变量

在Python中变量的声明不需要关键字,因为Python是动态语言,与Java和C#这类静态语言不一样,直接输入变量名然后赋值即可。

Linux下Python学习笔记 1:数据类型

如果从数学上理解x = x + 1那无论如何是不成立的,在程序中,赋值语句先计算右侧的表达式x + 1,得到结果2,再赋给变量x。由于x之前的值是1,重新赋值后,x的值变成2。

最后,理解变量在计算机内存中的表示也非常重要。当我们写: a = 'ABC' 时,Python解释器干了两件事情:

1. 在内存中创建了一个 'ABC' 的字符串;

2. 在内存中创建了一个名为 a 的变量,并把它指向 'ABC'

也可以把一个变量a赋值给另一个变量b,这个操作实际上是把变量b指向变量a所指向的数据,例如下面的代码:

最后一行打印出变量b的内容是'XYZ'如果从数学意义上理解,就会错误地得出b和a相同,也应该是'XYZ',但实际上b的值是'ABC',让我们一行一行地执行代码,就可以看到到底发生了什么事:

执行 a = 'ABC' ,解释器创建了字符串  'ABC'和变量 a,并把a指向 'ABC':

Linux下Python学习笔记 1:数据类型

执行 b = a ,解释器创建了变量 b,并把b指向 a 指向的字符串'ABC':

Linux下Python学习笔记 1:数据类型

执行 a = 'XYZ' ,解释器创建了字符串'XYZ',并把a的指向改为'XYZ',但b并没有更改:

Linux下Python学习笔记 1:数据类型

所以,最后打印变量 b 的结果自然是 'ABC' 了。

五、List 和 Tuple

Python内置的一种数据类型是列表: list

list是一种有序的集合,可以随时添加和删除其中的元素。

比如,列出班里所有同学的名字,就可以用一个list表示:

list是数学意义上的有序集合,也就是说,list中的元素是按照顺序排列的。

构造list非常简单,按照上面的代码,直接用 [ ] 把list的所有元素都括起来,就是一个list对象。通常,我们会把list赋值给一个变量,这样,就可以通过变量来引用list:

由于Python是动态语言,所以list中包含的元素并不要求都必须是同一种数据类型,我们完全可以在list中包含各种数据:

一个元素也没有的list,就是空list:

Linux下Python学习笔记 1:数据类型

同其他语言的列表一样,也是支持下标索引的,正数为升序,负数为降序。

Linux下Python学习笔记 1:数据类型

同样可以插入数据,append表示追加,即总是加入到列表的最后,insert可以根据需要插入到指定位置。

Linux下Python学习笔记 1:数据类型

也可以删除,删除使用pop(),表示总是移除最后一个,也可以指定位置移除。

Linux下Python学习笔记 1:数据类型

替换,指定下标的值赋值即可替换。

六、Tuple

tuple 和 list 非常类似,但是,tuple一旦创建完毕,就不能修改了,完全只读,tuple没有 append()方法,也没有insert()和pop()方法。

创建tuple和创建list唯一不同之处是用 ( ) 替代了 [ ]

同样是表示班里同学的名称,用tuple表示如下:

tuple和list一样,可以包含 0 个、1个和任意多个元素。

包含多个元素的 tuple,前面我们已经创建过了。

包含 0 个元素的 tuple,也就是空tuple,直接用 ()表示:

创建包含1个元素的 tuple 呢?来试试:

好像哪里不对!t 不是 tuple ,而是整数1。 为什么 呢?

因为 () 既可以表示tuple,又可以作为括号表示运算时的优先级,结果 (1) 被Python解释器计算出结果 1,导致我们得到的不是tuple,而是整数 1。

正是因为用()定义单元素的tuple有歧义,所以 Python 规定,单元素 tuple 要多加一个逗号“,”,这样就避免了歧义:

Python在打印单元素tuple时,也自动添加了一个“,”,为了更明确地告诉你这是一个tuple。

多元素 tuple 加不加这个额外的“,”效果是一样的:

前面我们看到了tuple一旦创建就不能修改。现在,我们来看一个“可变”的tuple:

Linux下Python学习笔记 1:数据类型

注意到 t 有 3 个元素: 'a','b' 和一个list: ['A', 'B'] 。list作为一个整体是tuple的第3个元素。list对象可以通过 t[2] 拿到:

然后,我们把list的两个元素改一改:

再看看tuple的内容:

不是说tuple一旦定义后就不可变了吗?怎么现在又变了?

别急,我们先看看定义的时候tuple包含的3个元素:

Linux下Python学习笔记 1:数据类型

当我们把list的元素 'A'和'B' 修改为 'X'和'Y' 后,tuple变为:

Linux下Python学习笔记 1:数据类型

表面上看,tuple的元素确实变了,但其实变的不是 tuple 的元素,而是list的元素。

tuple一开始指向的list并没有改成别的list,所以,tuple所谓的 “不变” 是说,tuple的每个元素,指向永远不变。即 指向'a',就不能改成指向'b' ,指向一个list,就不能改成指向其他对象,但指向的这个list本身是可变的!

理解了 “指向不变” 后,要创建一个内容也不变的tuple怎么做?那就必须保证tuple的每一个元素本身也不能变,比如讲上面的t[2]的list也改为tuple。

Linux下Python学习笔记 1:数据类型

正文到此结束
Loading...