一文搞懂 DNS 基礎(chǔ)知識,收藏起來有備無患~
DNS(Domain Name System), 也叫網(wǎng)域名稱系統(tǒng),是互聯(lián)網(wǎng)的一項(xiàng)服務(wù)。它實(shí)質(zhì)上是一個 域名 和 IP 相互映射的分布式數(shù)據(jù)庫,有了它,我們就可以通過域名更方便的訪問互聯(lián)網(wǎng)。
DNS 有以下特點(diǎn):
- 分布式的
- 協(xié)議支持 TCP 和 UDP,常用端口是 53
- 每一級域名的長度限制是 63
- 域名總長度限制是 253
那么,什么情況下使用 TCP,什么情況下使用 UDP 呢?
最早的時候,DNS 的 UDP 報(bào)文上限大小是 512 字節(jié), 所以當(dāng)某個 response 大小超過512 (返回信息太多),DNS 服務(wù)就會使用 TCP 協(xié)議來傳輸。后來 DNS 協(xié)議擴(kuò)展了自己的UDP 協(xié)議,DNS client 發(fā)出查詢請求時,可以指定自己能接收超過512字節(jié)的 UDP 包, 這種情況下,DNS 還是會使用 UDP 協(xié)議。
分層的數(shù)據(jù)庫結(jié)構(gòu)
DNS 的結(jié)構(gòu)跟 Linux 文件系統(tǒng)很相似,像一棵倒立的樹。下面用站長之家的域名舉例:
最上面的.是根域名,接著是頂級域名com,再下來是站長之家域名 chinaz 依次類推。使用域名時,從下而上。s.tool.chinaz.com. 就是一個完整的域名,www.chinaz.com. 也是。
根域名服務(wù)器只管理頂級域,同時把每個頂級域的管理委派給各個頂級域,所以當(dāng)你想要申請com下的二級域名時,找 com 域名注冊中心就好了。例如你申請了上圖的 chinaz.com 二級域名,chinaz.com 再向下的域名就歸你管理了。當(dāng)你管理 chinaz.com 的子域名時,你可以搭建自己的 nameserver,在 .com 注冊中心把 chinaz.com 的管理權(quán)委派給自己搭建的nameserver。自建nameserver 和不自建的結(jié)構(gòu)圖如下:
一般情況下,能不自建就不要自建,因?yàn)榫S護(hù)一個高可用的 DNS 也并非容易。據(jù)我所知,有兩種情況需要搭建自己的 nameserver:
-
搭建對內(nèi)的 DNS。公司內(nèi)部機(jī)器眾多,通過 IP?相互訪問太過凌亂,這時可以搭建對內(nèi)的 nameserver,允許內(nèi)部服務(wù)器通過域名互通 -
公司對域名廠商提供的 nameserver 性能不滿意。雖然頂級域名注冊商都有自己的nameserver,但注冊商提供的 nameserver 并不專業(yè),在性能和穩(wěn)定性上無法滿足企業(yè)需求,這時就需要企業(yè)搭建自己的高性能 nameserver,比如增加智能解析功能,讓不同地域的用戶訪問最近的 IP,以此來提高服務(wù)質(zhì)量
概括一下 DNS 的分布式管理, 當(dāng)把一個域委派給一個nameserver后,這個域下的管理權(quán)都交由此nameserver處理。這種設(shè)計(jì)一方面解決了存儲壓力,另一方面提高了域名管理的靈活性 (這種結(jié)構(gòu)像極了Linux File System, 可以把任何一個子目錄掛載到另一個磁盤,還可以把它下面的子目錄繼續(xù)掛載出去)
頂級域名
像 com 這樣的頂級域名,由 ICANN 嚴(yán)格控制,是不允許隨便創(chuàng)建的。頂級域名分兩類:
- 通用頂級域名
- 國家頂級域名
通用頂級域名常見的如.com、.org、.edu等, 國家頂級域名如我國的.cn, 美國的.us。一般公司申請公網(wǎng)域名時,如果是跨國產(chǎn)品,應(yīng)該選擇通用頂級域名;如果沒有跨國業(yè)務(wù),看自己喜好(可以對比各家頂級域的服務(wù)、穩(wěn)定性等再做選擇)。這里說一下幾個比較熱的頂級域,完整的頂級域參見維基百科。
me
me頂級域其實(shí)是國家域名, 是黑山共和國的國家域名,只不過它對個人開發(fā)申請,所以很多個人博主就用它作為自己的博客域名(本博客也是這么來的~)
io
很多開源項(xiàng)目常用io做頂級域名,它也是國家域名。因?yàn)閕o 與計(jì)算機(jī)中的 input/output 縮寫相同,和計(jì)算機(jī)的二機(jī)制10也很像,給人一種geek的感覺。相較于.com域名,.io下的資源很多,更多選擇。
DNS 解析流程
聊完了 DNS 的基本概念,我們再來聊一聊 DNS 的解析流程。當(dāng)我們通過瀏覽器或者應(yīng)用程序訪問互聯(lián)網(wǎng)時,都會先執(zhí)行一遍 DNS 解析流程。標(biāo)準(zhǔn) glibc 提供了 libresolv.so.2 動態(tài)庫,我們的應(yīng)用程序就是用它進(jìn)行域名解析(也叫 resolving)的, 它還提供了一個配置文件/etc/nsswitch.conf
?來控制 resolving 行為,配置文件中最關(guān)鍵的是這行:
它決定了 resolving 的順序,默認(rèn)是先查找 hosts 文件,如果沒有匹配到,再進(jìn)行 DNS 解析。默認(rèn)的解析流程如下圖:
上圖主要描述了 client 端的解析流程,我們可以看到最主要的是第四步請求本地 DNS 服務(wù)器去執(zhí)行 resolving,它會根據(jù)本地 DNS 服務(wù)器配置,發(fā)送解析請求到遞歸解析服務(wù)器(稍后介紹什么是遞歸解析服務(wù)器), 本地 DNS 服務(wù)器在 /etc/resolv.conf 中配置。下面我們再來看看服務(wù)端的 resolving 流程:
我們分析一下解析流程:
- 客戶端向本地DNS服務(wù)器(遞歸解析服務(wù)器) 發(fā)出解析tool.chinaz.com域名的請求
- 本地dns服務(wù)器查看緩存,是否有緩存過tool.chinaz.com域名,如果有直接返回給客戶端;
如果沒有執(zhí)行下一步
- 本地dns服務(wù)器向根域名服務(wù)器發(fā)送請求,查詢com頂級域的nameserver 地址
- 拿到com域名的IP后,再向com nameserver發(fā)送請求,獲取chinaz域名的nameserver地址
- 繼續(xù)請求 chinaz 的nameserver,獲取 tool 域名的地址,最終得到了tool.chinaz.com 的 IP,本地 dns 服務(wù)器把這個結(jié)果緩存起來,以供下次查詢快速返回
- 本地dns服務(wù)器把把結(jié)果返回給客戶端
遞歸解析服務(wù)器 vs 權(quán)威域名服務(wù)器
緩存
由于整個解析過程非常復(fù)雜,所以 DNS 通過緩存技術(shù)來實(shí)現(xiàn)服務(wù)的魯棒性。當(dāng)遞歸nameserver 解析過 tool.chianaz.com 域名后,再次收到 tool.chinaz.com 查詢時,它不會再走一遍遞歸解析流程,而是把上一次解析結(jié)果的緩存直接返回。并且它是分級緩存的,也就是說,當(dāng)下次收到的是 www.chinaz.com 的查詢時, 由于這臺遞歸解析服務(wù)器已經(jīng)知道 chinaz.com 的權(quán)威 nameserver,所以它只需要再向 chinaz.com nameserver 發(fā)送一個查詢 www 的請求就可以了。
根域名服務(wù)器遞歸解析服務(wù)器是怎么知道根域名服務(wù)器的地址的呢?根域名服務(wù)器的地址是固定的,目前全球有13個根域名解析服務(wù)器,這13條記錄持久化在遞歸解析服務(wù)器中:
為什么只有 13 個根域名服務(wù)器呢,不是應(yīng)該越多越好來做負(fù)載均衡嗎?之前說過 DNS 協(xié)議使用了 UDP 查詢, 由于 UDP 查詢中能保證性能的最大長度是 512 字節(jié),要讓所有根域名服務(wù)器數(shù)據(jù)能包含在512字節(jié)的UDP包中, 根服務(wù)器只能限制在13個, 而且每個服務(wù)器要使用字母表中單字母名
智能解析
智能解析,就是當(dāng)一個域名對應(yīng)多個 IP 時,當(dāng)你查詢這個域名的 IP,會返回離你最近的 IP。
由于國內(nèi)不同運(yùn)營商之間的帶寬很低,所以電信用戶訪問聯(lián)通的IP就是一個災(zāi)難,而智能 DNS 解析就能解決這個問題。
智能解析依賴 EDNS 協(xié)議,這是 google 起草的 DNS 擴(kuò)展協(xié)議, 修改比較簡單,就是在 DNS 包里面添加 origin client IP, 這樣 nameserver 就能根據(jù) client IP 返回距離 client 比較近的 server IP 了
國內(nèi)最新支持 EDNS 的就是 DNSPod 了,DNSPod 是國內(nèi)比較流行的域名解析廠商,很多公司會把域名利用DNSPod 加速, 它已經(jīng)被鵝廠收購
域名注冊商
一般我們要注冊域名,都要需要找域名注冊商,比如說我想注冊 hello.com,那么我需要找com域名注冊商注冊hello域名。com的域名注冊商不止一家, 這些域名注冊商也是從ICANN 拿到的注冊權(quán), 參見如何申請成為.com域名注冊商
那么,域名注冊商 和 權(quán)威域名解析服務(wù)器 ?有什么關(guān)系呢?
域名注冊商都會自建權(quán)威域名解析服務(wù)器,比如你在狗爹上申請一個.com下的二級域名,你并不需要搭建nameserver, 直接在godaddy控制中心里管理你的域名指向就可以了, 原因就是你新域名的權(quán)威域名服務(wù)器默認(rèn)由域名注冊商提供。當(dāng)然你也可以更換,比如從godaddy申請的境外域名,把權(quán)威域名服務(wù)器改成DNSPod,一方面加快國內(nèi)解析速度,另一方面還能享受DNSPod 提供的智能解析功能
用 bind 搭建域名解析服務(wù)器
由于網(wǎng)上介紹bind搭建的文章實(shí)在太多了,我就不再贅述了, 喜歡動手的朋友可以網(wǎng)上搜一搜搭建教程,一步步搭建一個本地的nameserver 玩一玩。這里主要介紹一下bind 的配置文件吧
bind 的配置文件分兩部分: bind配置文件 和 zone配置文件
bind 配置文件
bind 配置文件位于?/etc/named.conf
,它主要負(fù)責(zé) bind 功能配置,如 zone 路徑、日志、安全、主從等配置
其中最主要的是添加zone的配置以及指定zone配置文件。recursion 開啟遞歸解析功能, 這個如果是no, 那么此bind服務(wù)只能做權(quán)威解析服務(wù),當(dāng)你的bind服務(wù)對外時,打開它會有安全風(fēng)險(xiǎn),如何防御不當(dāng),會讓你的nameserver 被hacker 用來做肉雞
zone 配置文件
zone 的配置文件在 bind 配置文件中指定,下圖是一份簡單的 zone 配置:
zone的配置是 nameserver 的核心配置, 它指定了 DNS 資源記錄,如 SOA、A、CNAME、AAAA 等記錄,各種記錄的概念網(wǎng)上資料太多,我這里就不重復(fù)了。其中主要講一下 SOA 和 CNAME 的作用。
SOA記錄
SOA 記錄表示此域名的權(quán)威解析服務(wù)器地址。上文講了權(quán)威解析服務(wù)器和遞歸解析服務(wù)器的差別, 當(dāng)所有遞歸解析服務(wù)器中有沒你域名解析的緩存時,它們就會回源來請求此域名的SOA記錄,也叫權(quán)威解析記錄
CNAME
named-checkconf
?和?named-checkzone
?兩個命令來check我們的配置文件有沒有問題, 之后就可以啟動 bind 服務(wù)了:
我們用?netstat -ntlp
?來檢查一下服務(wù)是否啟動:
53 端口已啟動,那么我們測試一下效果, 用 dig 解析一下 www.hello.com 域名,使用127.0.0.1 作為遞歸解析服務(wù)器
我們看到 dig 的結(jié)果跟我們配置文件中配置的一樣是 1.2.3.4,DNS 完成了它的使命,根據(jù)域名獲取到 IP,但我們這里用來做示范的IP明顯是個假IP:)
用 DNS 實(shí)現(xiàn)負(fù)載均衡
其實(shí)每次DNS解析請求時,nameserver都會返回全部IP,如上面配置,它會把1.2.3.4 和1.2.3.5 都返回給client端。那么它是怎么實(shí)現(xiàn)RR的呢?nameserver 只是每次返回的IP排序不同,客戶端會把response里的第一個IP用來發(fā)請求。
DNS負(fù)載均衡 vs LVS專業(yè)負(fù)載均衡
和 LVS 這種專業(yè)負(fù)載均衡工具相比,在DNS層做負(fù)載均衡有以下特點(diǎn):
- 實(shí)現(xiàn)非常簡單
- 默認(rèn)只能通過RR方式調(diào)度
- DNS 對后端服務(wù)不具備健康檢查
- DNS 故障恢復(fù)時間比較長(DNS 服務(wù)之間有緩存)
- 可負(fù)載的 rs 數(shù)量有限(受 DNS response 包大小限制)
真實(shí)場景中,還需要根據(jù)需求選擇相應(yīng)的負(fù)載均衡策略
子域授權(quán)
我們從 .com 域下申請一個二級域名 hello.com 后, 發(fā)展到某一天我們的公司擴(kuò)大了,需要拆分兩個事業(yè)部A和B, 并且公司給他們都分配了三級域名 ?a.hello.com 和 b.hello.com, 域名結(jié)構(gòu)如下圖:
再發(fā)展一段時間,A部門和B部門內(nèi)部業(yè)務(wù)太多,需要頻繁的為新產(chǎn)品申請域名, 這個時候他們就想搭建自己的 namserver,并且需要上一級把相應(yīng)的域名管理權(quán)交給自己,他們期望的結(jié)構(gòu)如下:
注意第一階段和第二階段的區(qū)別:第一階段,A 部門想申請 a.hello.com 下的子域名,需要向上級申請,整個 a.hello.com 域的管理都在總公司;第二階段,A 部門先自己搭建 nameserver,然后總公司把 a.hello.com 域管理權(quán)轉(zhuǎn)交給自建的 nameserver, 這個轉(zhuǎn)交管理權(quán)的行為,就叫子域授權(quán)
子域授權(quán)分兩部操作:
- A部門自建 nameserver,并且在 zone 配置文件中指定 a.hello.com 的權(quán)威解析服務(wù)器為自己的 nameserver 地址
- 總公司在 nameserver 上增加一條 NS 記錄, 把 a.hello.com 域授權(quán)給 A 部門的 nameserver
第一步我們在用 bind 搭建域名解析服務(wù)器里講過, 只要在 zone 配置文件里指定SOA記錄就好:
第二步,在 hello.com 域的 nameserver 上添加一條NS記錄:
這樣當(dāng)解析 xx.a.hello.com 域名時,hello.com nameserver 發(fā)現(xiàn)配置中有 NS 記錄,就會繼續(xù)遞歸向下解析
DNS 調(diào)試工具
OPS 常用的 DNS 調(diào)試工具有:host,nslookup,dig
這三個命令都屬于 bind-utils 包, 也就是 bind 工具集,它們的使用復(fù)雜度、功能 依次遞增。關(guān)于它們的使用, man 手冊和網(wǎng)上有太多教程,這里簡單分析一下dig命令的輸出吧:
dig 的參數(shù)非常多, 功能也很多,詳細(xì)使用方法大家自行man吧
其他
DNS 放大攻擊
DNS 放大攻擊屬于DoS攻擊的一種,是通過大量流量占滿目標(biāo)機(jī)帶寬, 使得目標(biāo)機(jī)對正常用戶的請求拒絕連接從而掛掉。
思路
正常的流量攻擊,hack 機(jī)向目標(biāo)機(jī)建立大量 request-response,但這樣存在的問題是需要大量的 hack 機(jī)器。因?yàn)榉?wù)器一般的帶寬遠(yuǎn)大于家用網(wǎng)絡(luò), 如果我們自己的家用機(jī)用來做 hack 機(jī)器,還沒等目標(biāo)機(jī)的帶寬占滿,我們的帶寬早超載了。
原理
DNS 遞歸解析的流程比較特殊, 我們可以通過幾個字節(jié)的 query 請求,換來幾百甚至幾千字節(jié)的 resolving 應(yīng)答(流量放大), 并且大部分服務(wù)器不會對DNS服務(wù)器做防御。那么 hacker 們只要可以偽裝 DNS query 包的 source IP, 從而讓 DNS 服務(wù)器發(fā)送大量的 response 到目標(biāo)機(jī),就可以實(shí)現(xiàn) DoS 攻擊。
但一般常用的 DNS 服務(wù)器都會對攻擊請求做過濾,所以找 DNS 服務(wù)器漏洞也是一個問題。詳細(xì)的放大攻擊方法大家有興趣自行 google 吧,這里只做一個簡單介紹 :)
作者:多米諾
鏈接:https://juejin.cn/post/6844903497494855687文章轉(zhuǎn)載:高效運(yùn)維
(版權(quán)歸原作者所有,侵刪)