Python公众号文章采集器

此python项目是微信公众号文章采集器,用于爬取公众号文章以及把文章储存为word文档,并且也可以用于在word文档中添加超链接,同时也可以使用于待爬取的公众号列表。

应用介绍

import docx
from docx.enum.dml import MSO_THEME_COLOR_INDEX

def add_hyperlink(paragraph, text, url):
    # This gets access to the document.xml.rels file and gets a new relation id value
    part = paragraph.part
    r_id = part.relate_to(url, docx.opc.constants.RELATIONSHIP_TYPE.HYPERLINK, is_external=True)
    # Create the w:hyperlink tag and add needed values
    hyperlink = docx.oxml.shared.OxmlElement('w:hyperlink')
    hyperlink.set(docx.oxml.shared.qn('r:id'), r_id, )
    # Create a w:r element and a new w:rPr element
    new_run = docx.oxml.shared.OxmlElement('w:r')
    rPr = docx.oxml.shared.OxmlElement('w:rPr')
    # Join all the xml elements together add add the required text to the w:r element
    new_run.append(rPr)
    new_run.text = text
    hyperlink.append(new_run)
    # Create a new Run object and add the hyperlink into it
    r = paragraph.add_run ()
    r._r.append (hyperlink)
    # A workaround for the lack of a hyperlink style (doesn't go purple after using the link)
    # Delete this if using a template that has the hyperlink style in it
    r.font.color.theme_color = MSO_THEME_COLOR_INDEX.HYPERLINK
    r.font.underline = True
    return hyperlink

if __name__ == "__main__":
    pass

此项目是微信公众号文章采集器,并保存至word文档。

适应于新媒体运营人群和Python学习者。

文件列表(部分)

名称 大小 修改日期
add_hyperlinks.py0.60 KB2019-12-30
article_collector.py1.20 KB2019-12-30

立即下载

相关下载

[Python公众号文章采集器] 此python项目是微信公众号文章采集器,用于爬取公众号文章以及把文章储存为word文档,并且也可以用于在word文档中添加超链接,同时也可以使用于待爬取的公众号列表。

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部