python實現(xiàn)解析oui.txt并抽取MAC前綴及組織名稱

做無線抓包時就曾經(jīng)設(shè)想過顯示MAC地址所屬組織的名稱,一直在研究如何根據(jù)MAC查詢對應(yīng)的名稱。今天無意看到網(wǎng)上有相關(guān)文章宣羊,里面有介紹,使用C語言實現(xiàn)汰蜘。本文使用python來實現(xiàn)仇冯。

oui.txt文件可以在官網(wǎng)地址http://standards-oui.ieee.org/oui/oui.txt下載,該文件包含了MAC地址前綴(前MAC地址前三字節(jié)族操,下文直接使用“MAC地址”)赞枕、組織名稱(即公司名稱)、公司地址坪创、國家等信息炕婶。截至目前,一共有2萬多個記錄莱预。本文要做的柠掂,只是提取出MAC地址和對應(yīng)的組織名稱,再重新整理依沮,以方便程序查詢涯贞。

先看一下文件內(nèi)容:

00-CD-FE? (hex) Apple, Inc.

00CDFE? ? (base 16) Apple, Inc.

1 Infinite Loop

Cupertino? CA? 95014

US

第一部分為“xx-xx-xx”形式的MAC地址和名稱;第二部分類似危喉,但省略掉“-”宋渔;第三部分是公司地址信息(含國家,行數(shù)較多)辜限。文中選擇第二部分皇拣,因為可以直接將如“00CDFE”字符串轉(zhuǎn)換成十六進制使用。

提取MAC地址的設(shè)計思路很簡單薄嫡,如下:

1氧急、逐行讀取oui.txt,利用正則表達式查找上文所說的“第二部分”內(nèi)容毫深。并放到list中吩坝。

2、將list內(nèi)容排序哑蔫,方便使用二分查找算法钉寝,提高速度弧呐。

3、將MAC地址轉(zhuǎn)換成十六進制存儲(非字符串嵌纲,這樣省一點空間)俘枫,組織信息還是用字符串存儲。

4疹瘦、寫到文件中崩哩。其中頭部信息表示著記錄的數(shù)目巡球。數(shù)據(jù)部分即為MAC地址和組織信息言沐。組織信息前一字節(jié)表示該信息長度。

涉及到的python知識點:

1酣栈、正則表達式:re.findall(r"^[A-F0-9].[A-F0-9].[A-F0-9].+$", l)

2险胰、字符串轉(zhuǎn)換成數(shù)值:int(mac, 16)

3、字符串轉(zhuǎn)成二進制寫入文件:

f1 = open(BIN_FILE, "wb")

format='%ds' % len(org)

byte=struct.pack('i',mac_int) + struct.pack(format,str.encode(org))

f1.write(byte)

4矿筝、UTF8編碼:

reload(sys)

sys.setdefaultencoding('utf8')

完整代碼如下:

#!/usr/bin/python

# encoding: utf-8

# 解析oui.txt文件 Powred by Late Lee

# 注:文件編碼格式為utf-8起便,oui.txt也必須保證是uft-8

# 如果使用python3.4版本,則不需要調(diào)用 sys.setdefaultencoding('utf8')

# 生成bin文件格式:頭部共8字節(jié):前4字節(jié)表示一共有多少條記錄窖维,后面4字節(jié)表示最大組織名稱長度為多少榆综。數(shù)據(jù)部:MAC地址及組織名稱。

# 耗時2秒完成

import os

import re

import struct

import sys

OUI_FILE = "oui.txt"

TXT_FILE = "oui_txt.txt"

BIN_FILE = "oui.bin"

##################################

def write_file():

line=0

list =[]

try:

f = open(OUI_FILE, 'r')

while True:

l = f.readline()

if l == '': # end

break

line += 1

l = l.strip('\n') # not need \n

#print("#%d %s" % (line, l))

ret = re.findall(r"^[A-F0-9].[A-F0-9].[A-F0-9].+$", l) # eg 9C8E99

if len(ret) != 0:

mac = l[:6]

mac_int = int(mac, 16) # string to int number

org = l[22:]

org.strip()

test = mac+" "+org

list.append(test) # add to list

list.sort()

f.close()

except:

raise

line = 0

try:

f1 = open(BIN_FILE, "wb")

f2 = open(TXT_FILE, "w")

f1.write("0000")

for i in range(0, len(list)):

#print("%d %s" % (i, list[i]))

line += 1

mac = list[i][:6]

mac_int = int(mac, 16) # string to int number

org = list[i][7:]

format='%ds' % len(org) # how many bytes in org

org_byte = struct.pack(format,str.encode(org))

org_len = len(org)

byte=struct.pack('i',mac_int) + struct.pack('b',org_len) + struct.pack(format,str.encode(org)) # to byte

#print("333#%d 0x%x %d-->%s %s" % (i, mac_int, mac_int, org, org_byte))

f1.write(byte) # binary

test = mac + " " + org + "\n"

f2.write(test) # text

print("total number: %d max name len: %d" % (line, org_len))

f1.seek(0, 0)

byte=struct.pack('i',line)

f1.write(byte)

f1.close()

f2.close()

except:

raise

if __name__ == '__main__':

reload(sys)

sys.setdefaultencoding('utf8')

write_file()

至此铸史,就完成了MAC信息的提取鼻疮。最終的二進制文件存儲22982條記錄,空間只有600KB左右琳轿。文本形式的如下:

000000 XEROX CORPORATION

000001 XEROX CORPORATION

000002 XEROX CORPORATION

000003 XEROX CORPORATION

判沟。。崭篡。

FCFC48 Apple, Inc.

FCFE77 Hitachi Reftechno, Inc.

FCFEC2 Invensys Controls UK Limited

FCFFAA IEEE Registration Authority

文本僅描述一種方法挪哄。存儲可以使用定長和變長方式。如下:

1琉闪、使用定長存儲組織信息迹炼,這樣無需處理長度不一的組織名稱,方便編碼颠毙。但以犧牲空間為代價疗涉,比如使用100字節(jié)存儲名稱,則生成的文件大小由600KB上漲到2MB多吟秩。

2咱扣、如果要節(jié)省空間,可以在每條記錄中存儲組織名稱長度信息涵防,然后在代碼中根據(jù)此長度動態(tài)分配組織名稱長度闹伪。編碼相對復(fù)雜一點點沪铭。筆者喜歡這個方法。

參考資料:

1偏瓤、OUI文件:http://standards-oui.ieee.org/oui/oui.txt

2杀怠、http://www.cnblogs.com/Anker/archive/2013/12/22/3486344.html

李遲 2017.1.14 周六 凌晨

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市厅克,隨后出現(xiàn)的幾起案子赔退,更是在濱河造成了極大的恐慌,老刑警劉巖证舟,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件硕旗,死亡現(xiàn)場離奇詭異,居然都是意外死亡女责,警方通過查閱死者的電腦和手機漆枚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來抵知,“玉大人墙基,你說我怎么就攤上這事∷⑾玻” “怎么了残制?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長掖疮。 經(jīng)常有香客問我初茶,道長,這世上最難降的妖魔是什么氮墨? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任纺蛆,我火速辦了婚禮,結(jié)果婚禮上规揪,老公的妹妹穿的比我還像新娘桥氏。我一直安慰自己,他們只是感情好猛铅,可當(dāng)我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布字支。 她就那樣靜靜地躺著,像睡著了一般奸忽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上栗菜,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天欠雌,我揣著相機與錄音,去河邊找鬼疙筹。 笑死富俄,一個胖子當(dāng)著我的面吹牛禁炒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播霍比,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼幕袱,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了悠瞬?” 一聲冷哼從身側(cè)響起们豌,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎浅妆,沒想到半個月后望迎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡狂打,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年擂煞,在試婚紗的時候發(fā)現(xiàn)自己被綠了混弥。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片趴乡。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖蝗拿,靈堂內(nèi)的尸體忽然破棺而出晾捏,到底是詐尸還是另有隱情,我是刑警寧澤哀托,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布惦辛,位于F島的核電站,受9級特大地震影響仓手,放射性物質(zhì)發(fā)生泄漏胖齐。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一嗽冒、第九天 我趴在偏房一處隱蔽的房頂上張望呀伙。 院中可真熱鬧,春花似錦添坊、人聲如沸剿另。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽雨女。三九已至,卻和暖如春阳准,著一層夾襖步出監(jiān)牢的瞬間氛堕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工野蝇, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留讼稚,地道東北人位喂。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像乱灵,于是被迫代替她去往敵國和親塑崖。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容