網(wǎng)絡(luò)安全技術(shù)
一、內(nèi)容安全技術(shù)概述
互聯(lián)網(wǎng)破壞行為增加了互聯(lián)網(wǎng)用戶進(jìn)行業(yè)務(wù)活動(dòng)的風(fēng)險(xiǎn),也降低了互聯(lián)網(wǎng)信息服務(wù)的管理水平和服務(wù)質(zhì)量。
要阻止這些網(wǎng)絡(luò)破壞行為,營(yíng)造良好的網(wǎng)絡(luò)活動(dòng)氛圍,就需要建立一套功能完善、性能較好且易于維護(hù)和擴(kuò)展的移動(dòng)互聯(lián)網(wǎng)信息內(nèi)容安全技術(shù)體系。
通過(guò)可靠的檢測(cè)技術(shù)保護(hù)信息內(nèi)容安全,這種技術(shù)被稱為互聯(lián)網(wǎng)信息內(nèi)容安全技術(shù)。
二、內(nèi)容采集、過(guò)濾、審計(jì)技術(shù)
用戶要實(shí)現(xiàn)互聯(lián)網(wǎng)信息內(nèi)容安全,就必須依靠先進(jìn)的技術(shù)體系來(lái)保障。目前,整個(gè)技術(shù)流程可以分為對(duì)信息的采集、過(guò)濾和內(nèi)容審計(jì)3個(gè)步驟。
1、內(nèi)容采集技術(shù)
數(shù)據(jù)采集主要是指從本地?cái)?shù)據(jù)庫(kù)、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等數(shù)據(jù)源導(dǎo)入數(shù)據(jù),包括數(shù)據(jù)的提取、轉(zhuǎn)換和加載。由于數(shù)據(jù)源不一樣,數(shù)據(jù)采集的技術(shù)體系也不盡相同。
互聯(lián)網(wǎng)內(nèi)容采集主要采用的技術(shù)包括內(nèi)容協(xié)商、身份認(rèn)證、Web 信息采集和搜索引擎等。
(1)內(nèi)容協(xié)商機(jī)制
由于客戶端設(shè)備性能以及用戶喜好的不同,對(duì)同一個(gè)網(wǎng)絡(luò)對(duì)象質(zhì)量及形式的要求也會(huì)有所不同。
因此,在網(wǎng)絡(luò)中,一個(gè)網(wǎng)絡(luò)對(duì)象可能會(huì)有多種不同的表現(xiàn)形式,比如,同一個(gè)網(wǎng)絡(luò)資源會(huì)有不同的媒體類型的版本,也可能有不同語(yǔ)言的版本等。
在向Web服務(wù)器發(fā)送請(qǐng)求的時(shí)候,用戶將其對(duì)網(wǎng)絡(luò)資源的要求包含在請(qǐng)求中,Web服務(wù)器在接收到這樣的請(qǐng)求后,會(huì)根據(jù)自身的情況對(duì)請(qǐng)求做出適當(dāng)響應(yīng)。
雙方在確定了請(qǐng)求資源的版本后再進(jìn)行資源的獲取。這種客戶端和服務(wù)器之間通過(guò)協(xié)商的方式來(lái)獲得內(nèi)容的過(guò)程被稱為內(nèi)容協(xié)商,內(nèi)容協(xié)商機(jī)制已經(jīng)得到了HTTP的支持。
(2)基于Cookie的身份認(rèn)證
Web服務(wù)主要通過(guò)HTTP來(lái)實(shí)現(xiàn)瀏覽器和服務(wù)器之間的信息交互,由于HTTP是一種無(wú)狀態(tài)協(xié)議,它并不能在同一用戶不同時(shí)刻訪問(wèn)相同Web網(wǎng)站時(shí)進(jìn)行用戶信息的記憶與繼承,即HTTP協(xié)議無(wú)法對(duì)各個(gè)不同的用戶進(jìn)行區(qū)分,Cookie就是為了彌補(bǔ)HTTP這一缺陷而誕生的。
利用Cookie實(shí)現(xiàn)身份認(rèn)證是在傳統(tǒng)Cookie機(jī)制的基礎(chǔ)上,Web服務(wù)器使用自行定義的認(rèn)證方式,向通過(guò)認(rèn)證的客戶端傳遞一個(gè)代表客戶端身份的Cookie信息。
若客戶端后續(xù)發(fā)送的請(qǐng)求中包含此Cookie,服務(wù)器就通過(guò)這個(gè)Cookie來(lái)識(shí)別特定的客戶端,返回客戶端請(qǐng)求的頁(yè)面。
若客戶端后續(xù)發(fā)送的請(qǐng)求中不包含 Cookie,或者包含了一個(gè)服務(wù)器無(wú)法識(shí)別的Cookie,則服務(wù)器認(rèn)為這是一個(gè)新用戶的請(qǐng)求,如果用戶請(qǐng)求的是一個(gè)需要用戶認(rèn)證后才可以訪問(wèn)的'頁(yè)面,則服務(wù)器會(huì)返回一個(gè)認(rèn)證失敗的頁(yè)面,并要求用戶進(jìn)行身份認(rèn)證。
(3)Web信息采集技術(shù)
Web信息采集技術(shù)通過(guò)分析網(wǎng)頁(yè)的HTML代碼,獲取網(wǎng)內(nèi)的超級(jí)鏈接信息,使用廣度優(yōu)先搜索算法和增量存儲(chǔ)算法,實(shí)現(xiàn)自動(dòng)地連續(xù)分析鏈接、抓取文件、處理和保存數(shù)據(jù)的過(guò)程。
系統(tǒng)在再次運(yùn)行中通過(guò)應(yīng)用屬性對(duì)比技術(shù),在一定程度上避免了對(duì)網(wǎng)頁(yè)的重復(fù)分析和采集,提高了信息的更新速度和全部搜索率。
由于網(wǎng)站內(nèi)的資源常常分布在網(wǎng)內(nèi)不同的機(jī)器上,信息采集系統(tǒng)從某個(gè)給定的網(wǎng)址出發(fā),根據(jù)網(wǎng)頁(yè)中提供的超鏈接信息,連續(xù)地抓取網(wǎng)頁(yè)(既可以是靜態(tài)的,也可以是動(dòng)態(tài)的)和網(wǎng)絡(luò)中的文件,將網(wǎng)內(nèi)的信息進(jìn)行全部提取。
(4)搜索引擎
搜索引擎是指互聯(lián)網(wǎng)上專門提供檢索服務(wù)的一類網(wǎng)站,這些站點(diǎn)的服務(wù)器通過(guò)網(wǎng)絡(luò)搜索軟件或網(wǎng)絡(luò)登錄等方式,將Internet上大量網(wǎng)站的頁(yè)面信息收集到本地,
經(jīng)過(guò)加工處理建立信息數(shù)據(jù)庫(kù)和索引數(shù)據(jù)庫(kù),從而對(duì)用戶提出的各種檢索做出響應(yīng),提供用戶所需的信息或相關(guān)指針。
用戶的檢索途徑主要包括自由詞全文檢索、關(guān)鍵詞檢索、分類檢索及其他特殊信息的檢索等。
(5)其他采集技術(shù)
、倥老x技術(shù)。網(wǎng)絡(luò)爬蟲(Web Crawler),又稱為網(wǎng)絡(luò)蜘蛛(Web Spider)或Web信息采集器,是一個(gè)自動(dòng)下載網(wǎng)頁(yè)的計(jì)算機(jī)程序或自動(dòng)化腳本,是搜索引擎的重要組成部分。
網(wǎng)絡(luò)爬蟲通常從一個(gè)稱為種子集的URL集合開(kāi)始運(yùn)行,它首先將這些URL全部放到一個(gè)有序的待爬行隊(duì)列里,按照一定的順序從中取出URL并下載所指向的頁(yè)面,
分析頁(yè)面內(nèi)容,提取新的URL并存入待爬行URL隊(duì)列中,如此重復(fù)上面的過(guò)程,直到URL隊(duì)列為空或滿足某個(gè)爬行終止條件,從而遍歷Web,該過(guò)程稱為網(wǎng)絡(luò)爬行(Web Crawling)。
、诰W(wǎng)絡(luò)信息挖掘技術(shù)。由于網(wǎng)絡(luò)可利用信息指數(shù)級(jí)地增長(zhǎng),信息需求者從海量的Web信息站點(diǎn)中檢索到有效信息并不容易。
網(wǎng)絡(luò)信息挖掘技術(shù)是數(shù)據(jù)挖掘技術(shù)、人工智能信息檢索、自然語(yǔ)言理解技術(shù)在網(wǎng)絡(luò)信息處理中的應(yīng)用。網(wǎng)絡(luò)信息挖掘有別于傳統(tǒng)的信息檢索,能夠在異構(gòu)數(shù)據(jù)組成的數(shù)據(jù)庫(kù)中,
從概念及相關(guān)因素的延伸比較上抽取出用戶需要的深層次的信息,幫助信息檢索者在茫茫數(shù)據(jù)海洋中快速獲取網(wǎng)絡(luò)信息。
2、內(nèi)容過(guò)濾技術(shù)
內(nèi)容過(guò)濾技術(shù)主要分為基于網(wǎng)關(guān)和基于代理兩類,一般來(lái)說(shuō),包括名單過(guò)濾技術(shù)、關(guān)鍵詞過(guò)濾技術(shù)、圖像過(guò)濾技術(shù)、模板過(guò)濾技術(shù)和智能過(guò)濾技術(shù)等。
(1)基于網(wǎng)關(guān)的內(nèi)容過(guò)濾
一般嵌入專門的安全網(wǎng)關(guān)或者防火墻等網(wǎng)關(guān)設(shè)備中,此種網(wǎng)絡(luò)設(shè)備一般通過(guò)靜態(tài)和動(dòng)態(tài)內(nèi)容過(guò)濾來(lái)進(jìn)行。
所謂靜態(tài)過(guò)濾,就是可自定義可信站點(diǎn)和禁止站點(diǎn)。比如,靜態(tài)過(guò)濾可以阻塞對(duì)“交友社區(qū)”的訪問(wèn),以拒絕訪問(wèn)“交友社區(qū)”的網(wǎng)站內(nèi)容。動(dòng)態(tài)過(guò)濾也很重要,因?yàn)镮nternet和Web都不是靜態(tài)的。
相反,新的網(wǎng)頁(yè)正以每年數(shù)以億計(jì)的速度添加到Web,每分鐘都有新的站點(diǎn)和頁(yè)面出現(xiàn)。此外,Web頁(yè)也不是一個(gè)單一的實(shí)體,而是由眾多獨(dú)立的組件組成,每個(gè)組件都有它們自己的URL,瀏覽器可以單獨(dú)和獨(dú)立地獲取它們。
其中,每個(gè)組件都可以通過(guò)其URL直接訪問(wèn),因此也可能是過(guò)濾對(duì)象。動(dòng)態(tài)內(nèi)容過(guò)濾可以通過(guò)設(shè)定URL中的關(guān)鍵詞來(lái)過(guò)濾含此關(guān)鍵詞的站點(diǎn)以確定用戶是否應(yīng)獲取某一請(qǐng)求的URL,即便該URL沒(méi)有明確定義。
比如,動(dòng)態(tài)過(guò)濾可以拒絕訪問(wèn)URL中有“Porn”字樣的所有站點(diǎn)。理想的防火墻不僅應(yīng)支持靜態(tài)內(nèi)容過(guò)濾,還應(yīng)能讓用戶選擇一個(gè)可以自行決定阻塞的廣泛類別列表。
這種功能可使互聯(lián)網(wǎng)管理者允許或阻止對(duì)任何站點(diǎn)類別的訪問(wèn)。而且,由于Internet始終都在變化,因此,應(yīng)當(dāng)定期用被歸入站點(diǎn)類型的新URL更新類別列表。
(2)基于代理的內(nèi)容過(guò)濾
主要通過(guò)專用的硬件代理上網(wǎng)設(shè)備實(shí)現(xiàn),一般是將設(shè)備配置成代理緩存服務(wù)器,并部署在企業(yè)用戶和Internet之間,這些優(yōu)化的專用設(shè)備就能夠智能地管理用戶的內(nèi)容請(qǐng)求。
當(dāng)用戶請(qǐng)求一個(gè)URL時(shí),請(qǐng)求首先到達(dá)設(shè)備相應(yīng)端口安全專用設(shè)備進(jìn)行認(rèn)證和授權(quán)。
如果請(qǐng)求的頁(yè)面中的對(duì)象已經(jīng)在該專用設(shè)備的本地緩存中,它們就從本地直接訪問(wèn)給用戶;如果不在本地緩存中,安全專用設(shè)備就作為用戶的代理,通過(guò)Internet和源服務(wù)器通信。
當(dāng)對(duì)象從源服務(wù)器返回時(shí),就保存在本地緩存中為后續(xù)的訪問(wèn)請(qǐng)求服務(wù),同時(shí)傳送一個(gè)拷貝給訪問(wèn)的用戶。整個(gè)過(guò)程被全程監(jiān)控,并作記錄,供訪問(wèn)報(bào)告統(tǒng)計(jì)提供依據(jù)。
3、內(nèi)容審計(jì)技術(shù)
網(wǎng)絡(luò)信息內(nèi)容審計(jì)是指通過(guò)采取一定的技術(shù)手段,監(jiān)管網(wǎng)絡(luò)中不良文字、圖片、視頻等各類信息的傳播行為,以保證網(wǎng)絡(luò)所傳播的各類信息內(nèi)容的健康性、合法性,提供干凈的網(wǎng)絡(luò)信息環(huán)境。
它側(cè)重于理解網(wǎng)絡(luò)所傳播的信息內(nèi)容,判斷信息內(nèi)容的性質(zhì),并根據(jù)相關(guān)的安全策略對(duì)非法、不良等各類網(wǎng)絡(luò)信息進(jìn)行有效控制和管理,是網(wǎng)絡(luò)安全中保障信息資源安全性的重要組成部分。
內(nèi)容審計(jì)技術(shù),是從網(wǎng)絡(luò)數(shù)據(jù)分組中提取出內(nèi)容,從而對(duì)信息內(nèi)容進(jìn)行監(jiān)控與監(jiān)管的技術(shù)。
主要應(yīng)用領(lǐng)域包括對(duì)郵件信息的審計(jì)、對(duì)上網(wǎng)外發(fā)信息(如發(fā)帖內(nèi)容)的審計(jì)、對(duì)聊天信息的審計(jì)。
內(nèi)容審計(jì)技術(shù)如應(yīng)用得當(dāng),可以作為網(wǎng)絡(luò)管理的有效工具,如被黑客等非法分子應(yīng)用,則可作為信息竊取的工具。
網(wǎng)絡(luò)信息內(nèi)容安全審計(jì)系統(tǒng)所需的相關(guān)技術(shù)支撐如下。
(1)數(shù)據(jù)分組捕獲技術(shù)
網(wǎng)絡(luò)數(shù)據(jù)分組是網(wǎng)絡(luò)信息內(nèi)容審計(jì)系統(tǒng)主要處理的對(duì)象,高效的數(shù)據(jù)分組獲取技術(shù)是內(nèi)容審計(jì)中不可或缺的關(guān)鍵技術(shù)。
目前,從網(wǎng)絡(luò)中捕獲數(shù)據(jù)分組有2種方式:一種是采用硬件方式,在網(wǎng)絡(luò)端采用專用的硬件對(duì)數(shù)據(jù)分組進(jìn)行捕獲;另一種是采用軟件方式,利用軟件通過(guò)計(jì)算機(jī)與網(wǎng)絡(luò)連接使用的網(wǎng)絡(luò)適配器來(lái)捕獲網(wǎng)絡(luò)數(shù)據(jù)分組。
(2)負(fù)載均衡技術(shù)
目前,網(wǎng)絡(luò)流量的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)超過(guò)了處理器處理能力的增長(zhǎng)速度,無(wú)論使用何種數(shù)據(jù)分組獲取技術(shù),利用單臺(tái)基于普通處理器的平臺(tái)無(wú)法進(jìn)行百兆流量的實(shí)時(shí)內(nèi)容分析。
利用負(fù)載均衡處理技術(shù)可以解決這個(gè)問(wèn)題,即將流量分成幾個(gè)部分,這些部分可以由多臺(tái)設(shè)備并行處理,從而可以降低單臺(tái)設(shè)備的負(fù)載,提高整個(gè)內(nèi)容審計(jì)系統(tǒng)的性能。
(3)模式匹配技術(shù)
網(wǎng)絡(luò)信息內(nèi)容審計(jì)系統(tǒng)在網(wǎng)絡(luò)關(guān)鍵點(diǎn)捕獲到數(shù)據(jù)分組后,需要利用模式匹配算法搜索該數(shù)據(jù)分組內(nèi)是否出現(xiàn)設(shè)定的敏感模式串,以發(fā)現(xiàn)可疑數(shù)據(jù)分組。
現(xiàn)有模式匹配按照不同的分類方法可分為不同的類別。按一次在待匹配文本中需要查找的模式串個(gè)數(shù)可分為單模式匹配和多模式匹配。
單模式匹配是指從文本串中一次只需要查找一個(gè)模式串,多模式匹配一次需要查找多個(gè)模式串。
若按匹配過(guò)程中是否允許誤差存在分類,則可分為精確模式匹配和相似模式匹配。
精確模式匹配算法要求從待匹配文本串中找出與模式串完全相同的字符串,相似模式匹配要求找出的字符串可以與模式串存在一定的誤差。
其實(shí),精確模式匹配也可以認(rèn)為是相似模式匹配的一個(gè)特例,即設(shè)定相似模式匹配的誤差為零。
【網(wǎng)絡(luò)安全技術(shù)】相關(guān)文章:
淺析網(wǎng)絡(luò)安全技術(shù)及應(yīng)用12-14
淺析網(wǎng)絡(luò)安全技術(shù)(一)01-20
網(wǎng)關(guān)攻擊技術(shù)對(duì)網(wǎng)絡(luò)安全的作用論文09-12
淺析網(wǎng)絡(luò)安全技術(shù)發(fā)展趨勢(shì)08-03
探析網(wǎng)絡(luò)安全與防范技術(shù) (1) -電腦資料01-01
網(wǎng)絡(luò)安全分析的大數(shù)據(jù)技術(shù)實(shí)踐解析論文06-26