寫(xiě)在開(kāi)始
??這是本系列的第三篇文章,主要介紹如何用Python
+Selenium
自動(dòng)發(fā)布CSDN博客揖闸,一些必要的條件在之前的文章里面已經(jīng)提到過(guò)玄柏,這里也不再重復(fù)畸写。
使用說(shuō)明
??同樣的兔辅,還是需要先分析下CSDN寫(xiě)博客的界面(記得設(shè)置默認(rèn)編輯器為Markdown)腊敲。


??從上面兩張圖可以看到,在CSDN平臺(tái)寫(xiě)一篇博客维苔,依次需要填入標(biāo)題和內(nèi)容信息碰辅。如果是發(fā)布博客操作,還需要選擇文章類型介时、博客分類没宾、個(gè)人分類(可選)以及填寫(xiě)文章標(biāo)簽(可選)等信息。
??我們結(jié)合auto.md
的內(nèi)容進(jìn)行分析沸柔,標(biāo)題定義在title
處循衰;正文內(nèi)容通過(guò)匹配-->\n
獲取褐澎;剩下文章類型会钝、博客分類、文章標(biāo)簽和個(gè)人分類工三,按規(guī)則已經(jīng)提前定義在注釋中迁酸,分別對(duì)應(yīng)csdn_article_category
、csdn_blog_category
俭正、self_tags
和self_category
奸鬓。
代碼說(shuō)明
??main.py:程序入口類,主要負(fù)責(zé)正則匹配解析Markdown
和調(diào)用post
發(fā)布文章
import re
import csdn
import linecache
class Main(object):
# init
def __init__(self, file):
self.title = ''
self.content = ''
self.category = ''
self.tags = ''
# OsChina的系統(tǒng)分類, 設(shè)個(gè)默認(rèn)值
self.osChina_sys_category = '編程語(yǔ)言'
# CSDN的文章分類, 設(shè)個(gè)默認(rèn)值
self.csdn_article_category = '原創(chuàng)'
# CSDN的博客分類, 設(shè)個(gè)默認(rèn)值
self.csdn_blog_category = '后端'
self.read_file(file)
# 讀取MD中的title, content, self_category, self_tags, osChina_sys_category, csdn_article_category, csdn_blog_category
def read_file(self, markdown_file):
self.title = linecache.getline(markdown_file, 2).split('title: ')[1].strip('\n')
with open(markdown_file, 'r', encoding='UTF-8') as f:
self.content = f.read().split('-->\n')[1]
# 重置文件指針偏移量
f.seek(0)
for line in f.readlines():
if re.search('self_category: ', line) is not None:
self.category = line.split('self_category: ')[1].strip('\n')
elif re.search('self_tags: ', line) is not None:
self.tags = line.split('self_tags: ')[1].strip('\n')
elif re.search('osChina_sys_category: ', line) is not None:
self.osChina_sys_category = line.split('osChina_sys_category: ')[1].strip('\n')
elif re.search('csdn_article_category: ', line) is not None:
self.csdn_article_category = line.split('csdn_article_category: ')[1].strip('\n')
elif re.search('csdn_blog_category: ', line) is not None:
self.csdn_blog_category = line.split('csdn_blog_category: ')[1].strip('\n')
if __name__ == '__main__':
md_file = 'auto.md'
print("Markdown File is ", md_file)
timeout = 10
main = Main(md_file)
# CSDN
csdn = csdn.CSDN()
csdn.post(main, timeout)
??authorize.py:目前僅實(shí)現(xiàn)了用qq進(jìn)行授權(quán)登錄的方法
from selenium.webdriver.support.wait import WebDriverWait
# QQ授權(quán)登錄, 使用前提是QQ客戶端在線
def qq(driver, timeout):
# 切換到最新打開(kāi)的窗口
window_handles = driver.window_handles
driver.switch_to.window(window_handles[-1])
print('qq authorize title is ', driver.title)
# 切換iframe
iframe = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_id('ptlogin_iframe'))
driver.switch_to.frame(iframe)
# 點(diǎn)擊頭像進(jìn)行授權(quán)登錄
login = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_xpath('//*[@id="qlogin_list"]/a[1]'))
login.click()
??csdn.py:這個(gè)是CSDN自動(dòng)寫(xiě)(發(fā))博客的核心類
import time
import authorize
from selenium import webdriver
from selenium.webdriver.support.ui import Select
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains
# CSDN
class CSDN(object):
@staticmethod
def post(main, timeout, self_timeout=5):
# 1.賬號(hào)密碼
account = 'xxx'
password = 'xxx'
# 2.跳轉(zhuǎn)登陸
login = 'https://passport.csdn.net/account/login'
driver = webdriver.Chrome()
driver.get(login)
# 3.窗口最大化
driver.maximize_window()
# 4.使用賬號(hào)密碼登陸
# login_by_account = WebDriverWait(driver, timeout).until(
# lambda d: d.find_element_by_xpath('/html/body/div[3]/div/div/div[2]/div/h3/a'))
# login_by_account.click()
# time.sleep(self_timeout)
# driver.find_element_by_id('username').send_keys(account)
# driver.find_element_by_id('password').send_keys(password)
# driver.find_element_by_xpath('//*[@id="fm1"]/input[8]').click()
# 4.使用QQ授權(quán)登錄
driver.find_element_by_id('qqAuthorizationUrl').click()
driver.close()
authorize.qq(driver, timeout)
# 5.點(diǎn)擊"寫(xiě)博客"
write_blog = WebDriverWait(driver, timeout).until(
lambda d: d.find_element_by_xpath('/html/body/div[1]/div/div/ul/li[3]/a'))
write_blog.click()
driver.close()
window_handles = driver.window_handles
driver.switch_to.window(window_handles[-1])
# 6.點(diǎn)擊"開(kāi)始寫(xiě)作"
start = WebDriverWait(driver, timeout).until(
lambda d: d.find_element_by_xpath('//*[@id="btnStart"]'))
start.click()
# 7.填寫(xiě)標(biāo)題, 內(nèi)容
time.sleep(self_timeout)
title = driver.find_element_by_xpath('//*[@id="txtTitle"]')
title.clear()
title.send_keys(main.title)
# PS:下面這行代碼很重要掸读,卡了好久才解決┭┮﹏┭┮串远,不信可以試試注釋掉這句
ActionChains(driver).click(title).perform()
content = driver.find_element_by_xpath('//*[@id="wmd-input"]/div[1]')
content.clear()
content.send_keys(main.content)
# 8.保存草稿
# driver.find_element_by_xpath('//*[@id="editorBox"]/div[2]/div/button[2]').click()
# 8.發(fā)布文章
driver.find_element_by_xpath('//*[@id="editorBox"]/div[2]/div/button[1]').click()
# 9.若第8步選擇"發(fā)布文章", 往下需依次填寫(xiě)標(biāo)簽,個(gè)人分類儿惫,文章類型澡罚,博客分類
tags = main.tags.split(',')
add_tag = WebDriverWait(driver, timeout).until(lambda d: d.find_element_by_id('addTag'))
for i, tag in enumerate(tags):
add_tag.click()
tag_input = WebDriverWait(driver, timeout).until(
lambda d: d.find_element_by_xpath('//*[@id="tagBox"]/div[' + str(i + 1) + ']/span'))
tag_input.send_keys(tag)
classify = driver.find_elements_by_class_name('form-check-label')
for c in classify:
html = c.get_attribute('innerHTML')
if main.category in html:
c.click()
select = Select(driver.find_element_by_id('selType'))
select.select_by_visible_text(main.csdn_article_category)
select = Select(driver.find_element_by_id('radChl'))
select.select_by_visible_text(main.csdn_blog_category)
# 10.保存草稿
driver.find_element_by_xpath('//*[@id="meditor_box"]/div[3]/div/div[6]/input[2]').click()
# 10.發(fā)布文章
# driver.find_element_by_xpath('//*[@id="meditor_box"]/div[3]/div/div[6]/input[3]').click()
time.sleep(self_timeout)
??CSDN支持賬號(hào)密碼登錄姥闪,也可以用qq授權(quán)的方式始苇,后期只需要擴(kuò)展authorize.py
的功能,就可以支持更多的第三方平臺(tái)進(jìn)行授權(quán)登錄筐喳。
運(yùn)行效果
??還是來(lái)看看運(yùn)行效果圖吧,這里僅測(cè)試保存草稿函喉。

寫(xiě)在最后
??在CSDN平臺(tái)自動(dòng)寫(xiě)文章的流程大概也就這樣避归,同樣這不是唯一的辦法,也不敢保證程序可以一直正常運(yùn)行下去管呵∈岜校總而言之,這個(gè)花的時(shí)間是最多捐下,因?yàn)橐恢笨ㄔ诹四骋稽c(diǎn)上账锹,不過(guò)還好最后還是解決了萌业。本系列還有最后一篇,將介紹如何結(jié)合bat腳本在多個(gè)平臺(tái)同時(shí)發(fā)布文章奸柬,以及對(duì)系列做一個(gè)簡(jiǎn)單的總結(jié)生年,敬請(qǐng)期待。