python内置数据类型之字符串-老马黑科技

1. 什么是字符串？

字符串是一个个字符组成的有序的序列，是字符的集合；
字符串用单引号、双引号或三引号括起来，同时使用反斜杠来转义特殊字符。；
字符是不可变的对象；
空格也是字符。

2. 字符串的定义

复制

l = 'hello,mykernel'
print(l)
hello,mykernel

说明：

一对单引号和一对双引号效果完全一样；
三对单引号和三对双引号效果完全一样；
三对引号可以定义多行字符串，且不需要转义符转义特殊字符。

3. 字符串的相关操作

1. 字符串的分隔

1. split()操作

复制

print('l love python'.split())
# split()的()中指定分隔符
# 默认使用空格作为分隔符

# maxsplit=# 可以指定分隔的次数。
print('my name is  mykernel'.split('m',maxsplit=1))

#分隔符可以是任意字符串。
['l', 'love', 'python']
['', 'y name is  mykernel']

2. rsplit()

从右往左分隔。

复制

print('my name is  mykernel'.rsplit('m',maxsplit=1))

#当不用maxsplit= 时候，split和rsplit效果一样，但是split效率更高。
['my name is  ', 'ykernel']

3. splitlines

按行进行分隔，返回分隔的结果，不带换行符。

复制

l = """l love python
i am mykernel
"""
l.splitlines()
['l love python', 'i am mykernel']

4. partition

partition()总是返回一个三元组，它按传入的分割符分割一次。打印分割符的前半部分，分隔符本身和后半部分。

复制

l = """l love python"""
l.partition(' ')

#partition() 不能不传入分隔符，只分隔一次，打印内容，为前半部分、分隔符和后半部分.
('l', ' ', 'love python')

2. 字符的大小写转换

1. upper()

小写转大写，upper()方法。

复制

l = """l love python"""
l2= l.upper()
print(l2)
L LOVE PYTHON

2. lower()

大写转小写，lower()方法。

复制

l2.lower()
'l love python'

3. title()和capitalize()

首字母转大写，title()和capitalize()方法

复制

l = 'l love python'
str2 = l.title()
print(l.title())  #做文章的标题，每个字母的首字母大写
print(l.capitalize()) #做正文段落的开始，第一个首字母大写
L Love Python
L love python

4. casefold()

忽略大小写，casefold()方法

复制

print(str2)
print(str2.casefold())
L Love Python
l love python

3. 字符串的修改

1. replace()

replace() 字符串的替换，只能从左到右的替换。

复制

str = 'i love python'
str.replace('love python','am mykernel')  #前边是旧的字符串，后边是新的字符串。
'i am mykernel'

可以加上第三参数，控制修改的个数。

复制

str = 'i very very very love python '
str.replace('very','非常',2)  #替换2个
'i 非常 非常 very love python '

2. strip()

strip()方法，移除前后的空白(\n，\t，\r)

复制

str = '   mykernel   love  python   \n'
print(str)
str2 = str.strip()
print(str2)
   mykernel   love  python   

mykernel   love  python

去掉两端可以匹配到的字符

复制

s = '<str>>'
s.strip('<r>')
'st'

lstrip()只移除左侧部分;
rstrip()只移除右侧部分。

3. ljust()、just()和center()

填充字符串。

ljust() 右侧填充
rjust() 左侧填充
center()两侧填充

复制

print('mykernel'.ljust(30))
print('mykernel'.rjust(30))
print('mykernel'.center(30))  #一边15个。。。。
mykernel                      
                      mykernel
           mykernel

可以指定填充字符，但是不能指定多个字符。

复制

print('mykernel'.ljust(30,'+'))
print('mykernel'.rjust(30,'#'))
print('mykernel'.center(30,'*'))  #一边15个。。。。
mykernel++++++++++++++++++++++
######################mykernel
***********mykernel***********

说明：需要填充的长度=指定的长度-原字符串长度，如果原字符串为8，用center()指定的长度为9，则只填充左侧。如果指定的宽度小于等于原厂不做任何操作。

4.字符串的查找

1.find()

find(sub[, start[, end]]) 在指定的区间，从左到右查找，找到返回对应的索引值，没找到返回-1.

rfind(sub[, start[, end]]) 在指定的区间，从右到左查找，找到返回对应的索引值，没找到返回-1.

复制

str = 'i very very very love python '
print(str.find('very'))
print(str.find('very',5))
print(str.rfind('very',4))
print(str.rfind('very',-20,-1))
2
7
12
12

2. index()

index(sub[, start[, end]]) 在指定的区间，从左到右。找到返回对应的索引值，没找到返回ValueError。

rindex(sub[, start[, end]]) 在指定的区间，从右到左。找到返回对应的索引值，没找到返回ValueError。

3. count()

count(sub[, start[, end]]) 在指定的区间，从左到右，统计子字符串sub出现的次数

复制

str = 'i very very very love python '
print(str.count('very'))
print(str.count('very',5))
print(str.count('very',5,11))
3
2
1

复制

len(str)  
##len()统计字符串的长度。个数即长度。
29

说明： index()和count()方法的时间复杂的为O(n)

5. 字符串的判断

1. startwith()

startwith(value,[start,[stop]]) 判断字符是不是以某个为单词开始的，返回true或者false。

复制

str = 'i am mykernel,i very very very love python'
print(str.startswith('am'))
print(str.startswith('i'))

## 也可以指定范围进行匹配。
print(str.startswith('am',2,20)) #（2,20]
False
True
True

2. endswith()

同startwith endswith(value,[start,[stop]]) 判断字符是不是以某个为单词结束的，返回true或者false。

复制

str = 'i am mykernel,i very very very love python'
print(str.endswith('am'))
print(str.endswith('python'))
False
True

6. 字符串拼接

1. +

复制

'i'+' love'+' python'
'i love python'

2. join()

复制

' '.join(['i'+' love'+' python'])
'i love python'

7. 字符串的格式化

字符串格式化是字符串拼接的一种手段。但是很重要，所以单独列出来。

1. printf style字符串格式化

复制

s = 'i love %s' #%s为格式占位符，然后再其他地方可以将参数传入并替换该占位符。
s%('python',) #将python传入，替换占位符。
'i love python'

说明：一个占位符需要传入一个参数，当传入的参数和占位符个数不匹配的时候会报错。当传入的类型不匹配时会出现“TpyeError”错误。

当占位符是s%时候，隐式的调用了str()，其传入的可以为任意类型；

当占位符是r%时候，隐式的调用了repr()方法。

常见的占位符：

s，获取传入对象的str方法的返回值，并将其格式化到指定位置
r，获取传入对象的repr方法的返回值，并将其格式化到指定位置
整数：将数字转换成其unicode对应的值，10进制范围为 0 <= i <= 1114111（py27则只支持0-255）；字符：将字符添加到指定位置
o，将整数转换成八进制表示，并将其格式化到指定位置
x，将整数转换成十六进制表示，并将其格式化到指定位置
d，将整数、浮点数转换成十进制表示，并将其格式化到指定位置
e，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（小写e）
E，将整数、浮点数转换成科学计数法，并将其格式化到指定位置（大写E）
f，将整数、浮点数转换成浮点数表示，并将其格式化到指定位置（默认保留小数点后6位）
F，同上
g，自动调整将整数、浮点数转换成浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是e；）
G，自动调整将整数、浮点数转换成浮点型或科学计数法表示（超过6位数用科学计数法），并将其格式化到指定位置（如果是科学计数则是E；）
%，当字符串中存在格式化标志时，需要用 %%表示一个百分号

2. format字符串格式化

a. format方法可以使用花括号作为占位符，传入的参数将替换花括号。

复制

s = 'i love {}' #{}作为占位符
s.format('python')
'i love python'

b. format方法的参数可以为多个，如果不在括号里指定其位置一一对应引入。

复制

s ='i love {}, i am {}'
s.format('python','mykernel')  #按照位置传入
'i love python, i am mykernel'

c. format方法可以在花括号里填入位置数字，其后的参数按照位置引入，从0号位置开始

复制

s ='i love {1}, i am {0}'
s.format('python','mykernel')
'i love mykernel, i am python'

同一个位置的参数可以引入多次。

复制

s ='i love {0}, i am {0}'
s.format('python','mykernel')
'i love python, i am python'

d. format方法可以用字符作为占位符的标志，方便识别。

复制

'i love {language},i am {name}'.format(language='python',name='mykernel')
'i love python,i am mykernel'

e. format方法的占位符可以混用，但是位置参数必须放在最前。

复制

'my name is {0},i love {language},i am {age}'.format('mykernel',language='pyrhon',age=18)
'my name is mykernel,i love pyrhon,i am 18'

说明1：

占位符的个数大于参数个数的时候，会抛出异常IndexError。
占位符的个数小于参数个数的时候，若对应的占位符能匹配到值则不报错，匹配不到值会返回异常。
当占位符出现混用的情况时，位置参数不在最前会返回异常。

说明2：

通常使用2.6或之后的版本使用format方法，2.6之前使用printf style。
在format中，需要注意的是，在2.6版本中是不能省略大括号里面的数字或者关键字。

python内置数据类型之字符串