下載 Google 機(jī)器學(xué)習(xí)速成課程

python3 https://www.python.org

從官網(wǎng)下載安裝或者用brew

$ brew linkapps python3
$ brew linkapps python3

pipenv https://github.com/pypa/pipenv

$ pip install pipenv

.zshrc

eval "$(pipenv --completion)"

request-html http://html.python-requests.org/en/latest/

$ git clone https://github.com/iOSDevLog/Machine-Learning-Crash-Course
$ cd Machine-Learning-Crash-Course
$ pipenv --python 3.6
$ pipenv install requests-html
$ pipenv shell     # To activate this project's virtualenv

fetch_course.py

#!/usr/bin/env python
import os
import ssl
import time

from requests_html import HTMLSession

ssl._create_default_https_context = ssl._create_unverified_context

base_url = 'https://developers.google.com/machine-learning/crash-course/'

def course_info(course_url):
    session = HTMLSession()
    request = session.get(course_url)

    data_video_url = ''
    data_captions_url = ''
    # video_info = request.html.find('.devsite-vplus', first=True)
    # data_video_url = video_info.attrs['data-video-url']
    # data_captions_url = video_info.attrs['data-captions-url']

    next_url_info = request.html.find('div.devsite-steps-next > a.devsite-steps-link', first=True)
    next_url = next_url_info.attrs['href']

    return (data_video_url, data_video_url, next_url)

import urllib.request

def getHtml(url):
    html = urllib.request.urlopen(url).read()
    return html

def saveHtml(file_name, file_content):
    dir = 'course_html/'
    file_name = file_name.replace('/','_')+'.html'
    path = os.path.join(dir, file_name)
    with open (path, 'wb') as f:
        f.write(file_content)

if __name__ == '__main__':
    next_url = 'https://developers.google.com/machine-learning/crash-course/framing/check-your-understanding'
    while next_url:
        try:
            (_, _, next_url) = course_info(next_url)
            filename = os.path.basename(next_url)
            html = getHtml(next_url)
            saveHtml(filename, html)
            print(next_url)
        except:
            time.sleep(5)
            print("Was a nice sleep, now let me continue...")
            continue

data_video_url 為mp4視頻相對(duì)地址
data_captions_url 為字幕相對(duì)地址

通過 base_url 可得到絕對(duì)地址,后面再寫吧。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市薪丁,隨后出現(xiàn)的幾起案子蜡感,更是在濱河造成了極大的恐慌洞难,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件辞嗡,死亡現(xiàn)場(chǎng)離奇詭異蝙云,居然都是意外死亡氓皱,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門勃刨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來波材,“玉大人,你說我怎么就攤上這事身隐⊥⑶” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵抡医,是天一觀的道長(zhǎng)躲因。 經(jīng)常有香客問我早敬,道長(zhǎng)忌傻,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任搞监,我火速辦了婚禮水孩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘琐驴。我一直安慰自己俘种,他們只是感情好秤标,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著宙刘,像睡著了一般苍姜。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上悬包,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天衙猪,我揣著相機(jī)與錄音,去河邊找鬼布近。 笑死垫释,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的撑瞧。 我是一名探鬼主播棵譬,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼预伺!你這毒婦竟也來了订咸?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤扭屁,失蹤者是張志新(化名)和其女友劉穎算谈,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體料滥,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡然眼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了葵腹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片高每。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖践宴,靈堂內(nèi)的尸體忽然破棺而出鲸匿,到底是詐尸還是另有隱情,我是刑警寧澤阻肩,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布带欢,位于F島的核電站,受9級(jí)特大地震影響烤惊,放射性物質(zhì)發(fā)生泄漏乔煞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一柒室、第九天 我趴在偏房一處隱蔽的房頂上張望渡贾。 院中可真熱鬧,春花似錦雄右、人聲如沸空骚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽囤屹。三九已至熬甚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間肋坚,已是汗流浹背则涯。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留冲簿,地道東北人粟判。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像峦剔,于是被迫代替她去往敵國(guó)和親档礁。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • # Python 資源大全中文版 我想很多程序員應(yīng)該記得 GitHub 上有一個(gè) Awesome - XXX 系列...
    小邁克閱讀 2,963評(píng)論 1 3
  • # Python 資源大全中文版 我想很多程序員應(yīng)該記得 GitHub 上有一個(gè) Awesome - XXX 系列...
    aimaile閱讀 26,448評(píng)論 6 428
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理吝沫,服務(wù)發(fā)現(xiàn)呻澜,斷路器,智...
    卡卡羅2017閱讀 134,628評(píng)論 18 139
  • “對(duì)了惨险!相機(jī)羹幸,相機(jī)!”我一個(gè)激靈想起我剛剛拍了照片辫愉,剛才忙著哭竟然忘了相機(jī)這么重要的證據(jù)栅受。 我打開相機(jī),翻開剛才拍...
    AgLian閱讀 305評(píng)論 0 0
  • ——選曲《只有你》 是否我唇齒每度開闔都能竊來眼波 我高唱頹喪輕視快樂可快樂才是我 是仿佛跌墮過這深壑有很深邃輪廓...
    畢畢剝剝閱讀 206評(píng)論 0 0