betway必威官网欢迎您-最新官方网站

点击立可下载开户即可下载betway必威官网欢迎您提供的所有游戏,因为最新官方网站与欧洲的八大电视台都展开了合作,betway必威官网欢迎您为你选择最优质的娱乐,欢迎您来体验试玩!。

您的位置:betway必威官网欢迎您 > 办公软件 > Python读写docx文件的方法,有哪些库可以直接使用

Python读写docx文件的方法,有哪些库可以直接使用

2019-09-29 23:48

问题:python如何编程word文档?有哪些库可以直接使用?

Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

回答:

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

这里介绍一个库—python-docx,专门用于python读写word文档,使用方便、快捷,下面我简单介绍一下这个库的安装和使用,实验环境win10+python3.6+pycharm5.0,主要内容如下:

帮助文档:http://python-docx.readthedocs.org/en/latest/

1.安装python-docx,这个直接在cmd窗口输入命令“pip install python-docx”就行,如下:

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档

图片 1

#coding:utf-8
import docx

#新建文档
doc_new = docx.Document()

#读取文档
doc = docx.Document(ur'C:1.docx')

2.安装完成后,我们就可以进行简单的测试了,这里我分别就读取word文档和写入word文档做了简单介绍,主要代码及截图如下:

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

  • 读取word文档,这里以读取文档中的段落文本和表格数据为例,示例文档如下:
doc.save(path_or_stream)

图片 2

3、对象集合。python-docx包含了word文档的相关对象集合。

对应读取代码如下,很简单,分别获取所有段落文本和表格数据,然后循环打印就行,readWord函数输入参数为需要读取的word文档:

doc.paragraphs #段落集合
doc.tables #表格集合
doc.sections #节 集合
doc.styles #样式集合
doc.inline_shapes #内置图形 等等...

图片 3

4、插入段落。段落是word最基本的对象之一。

程序运行截图如下,已经成功获取到word文档的内容:

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”
#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式
doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式
print [s.name for s in doc.styles if s.type==1]

图片 4

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。

  • 写入word文档,这个也很简单,构造相应数据结构,然后直接写入word文档就行,这里以添加标题、段落、图片、引用、表格,设置字体、有序列表和无序列表为例,主要测试代码如下:
#coding:utf-8
from docx import Document
from docx.shared import RGBColor #这个是docx的颜色类

#新建文档
doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)
style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)
style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

图片 5

6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。

图片 6

#插入一个空白段落
p = doc.add_paragraph('')
p.add_run('123', style="Heading 1 Char")
p.add_run('456')
p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式
print p.text #输出结果是u'123456789' 也还是连续的

图片 7

7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。

程序运行截图如下,已经成功创建并生成word文档:

p = doc.add_paragraph('')
r = p.add_run('123')
r.font.bold = True #加粗
r.font.italic = True #倾斜 等等...

图片 8

8、表格操作。表格也是经常用到的一种对象类型。

至此,我们就完成了利用python来编程word文档。总的来说,整个过程不难,思路不难,代码也不多,很好理解,只要你有一定的python基础,熟悉一下相关示例和代码,多练习一下,很快就能掌握的,python-docx官网也提供了非常详细的使用文档,非常适合初学者学习,介绍的很全面,可以参考一下

#新建一个2x3的表格,style可以不写
table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数
print len(table.rows)
print len(table.columns)

#遍历表格
for row in table.rows:
 row.cells[0].text = '1'
 #print row.cells[0].text

#新增行或列
table.add_row()
table.add_column()

回答:

Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。

python调用word接口主要用到python-docx模块,基本操作官方文档有说明。

以上这篇Python读写docx文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

图片 9

您可能感兴趣的文章:

  • Python使用win32com模块实现数据库表结构自动生成word表格的方法
  • 使用Python通过win32 COM实现Word文档的写入与保存方法
  • Python读取指定目录下指定后缀文件并保存为docx
  • python docx 中文字体设置的操作方法
  • Python读取Word(.docx)正文信息的方法
  • python3如何将docx转换成pdf文件
  • Ubuntu下使用python读取doc和docx文档的内容方法
  • python-docx修改已存在的Word文档的表格的字体格式方法
  • Python操作word常见方法示例【win32com与docx模块】

官方文档的链接在这儿没法发,需要的话可以私信笔者。

接下来我们一步一步的开始使用Python对wold文档进行操作:

  1. 安装python-docx模块
    打开命令提示符,输入“pip install python-docx”导入python-docx模块:
    图片 10下方显示Successfully installed python-docx-x.x.x说明你安装成功了。

  2. 打开编译器,导入Document和Inches包:
    图片 11

  3. 新建docx文件:
    图片 12

  4. 插入文档标题:
    图片 13

  5. 插入文档内容:
    图片 14

  6. 保存文件:
    图片 15

此时我们运行一下这个程序,在右侧文件列表中会出现“demo.docx”文件。

图片 16

我们去文件目录打开它看一下:

图片 17

是我们写的文件没错,这就是Python对word文档的基本操作。当然,不仅仅局限于插入标题和段落,还有图片表格等,笔者在这里就不一一介绍,若感兴趣请查阅官方文档~

图片 18

我是刘坏坏,盘点干货资源。如果我的回答有什么疏漏之处,请在下方评论或私信指出。如果对您有帮助,请点赞收藏。笔者稽首~

回答:

一、安装Python-docx

Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件。说白了,python就相当于windows操作系统,QQ就是跑在windows操作系统上的软件,QQ最大的作用是可以去聊天,说话。 在这里python-docx就相当于这里的qq 它主要的功能是对docx文件进行操作,管理等.(个人理解,非专业!)

1.1、安装Python-docx

1.1.1、使用虚拟环境安装python-docx

pip install python-docx # 安装命令

安装结束后,在此虚拟环境中运行Jupyter notebook

jupyter notebook

1.1.2、切换工作目录(使用 %cd命令)

%cd F:python_test1Python_office # 进入目录

%pwd # 查看当前的工作目录

>>>'F:\python_test1\Python_office' # 输出结果

二、对word文档进行编辑

在对word文档编辑之前需要导入Document模块如下:

from docx import Document

Doc = Document()

解释:from 从 docx这个文件中,导入一个叫Document的一个东西,Document是文档的意思,所以它是对word文档进行操作的一个玩意. 在下面Doc = Document() 可以理解为 Document就是一个类,这个操作也就是实例化的过程,生成对象为:Doc

那Document实例化了一个Object叫Doc 那么Doc肯定会有很多的方法,这些方法就是对word文档进行操作的方法如下:

Doc.add_heading("Python是什么东西???")

<docx.text.paragraph.Paragraph at 0x28033582e48>

# Doc.add_heading 意思是添加一个叫做heading的一个东西在这里heading指的是标题的意思,也就是添加一个标题叫做python是什么东西???运行完成后它会生成一个对象.

2.1、添加一个段落(paragraph)

Doc.add_paragraph("Python是一种面向对象的编程语言~~~") # 在这里paragraph指的就是一个段落的意思

<docx.text.paragraph.Paragraph at 0x280335a17b8>

2.2、添加多个段落(paragraph)

Doc.add_paragraph("Python ")

Doc.add_paragraph("Python 对word进行操作")

2.3、如何查看word文档?

写完之后我们需要查看首先需要保存 如下:

Doc.save("Python_word.docx")

# save:保存 为名字叫:Python_word.docx 的文件

回答:

与其考虑这个问题,不如和我学Java

回答:

不好意思,不许拍摄

回答:

库∶python-docx

上面的回答很详细了,没毛病。

本文由betway必威官网欢迎您发布于办公软件,转载请注明出处:Python读写docx文件的方法,有哪些库可以直接使用

关键词: