Half the truth is often a great lie.

美軍如何從社交媒體中提取情報

軍事 rock 10772℃ 0評論

在社交媒體環(huán)境,如Twitter中,這個問題變得尤為明顯,Twitter中使用的語言更加口語化,充滿了日常的表達、俚語和不同的情感意味,如諷刺、興奮和失望,并且表達得非常簡單,難以辨別說話的背景。在多語言國家,當(dāng)在線數(shù)據(jù)采用幾種語言時,這個問題可能會變得極具挑戰(zhàn)性。

“我們的Social Recon分析工具提供的結(jié)果是可被理解和可操作的,”他補充道。

這些工具能夠直接提供渠道,與鼓動或煽動民眾的人員聯(lián)系,還能通過其發(fā)表意見使用的社交媒體工具與他們接觸,或者在社交網(wǎng)站上與他們就某一個主題展開討論。

“同樣,利用我們的Social Recon工具,也可以聯(lián)絡(luò)那些提出不正確或負面評論的人士,并且無論出現(xiàn)哪些話題,都可以展開對話,”希門尼斯說。

這套工具還可以確定哪些地方流行的觀點不太正確或正在傳播錯誤的信息。

SAS公司的社交媒體分析(Social MediaAnalytics,SMA)提供了很多途徑,使人們可以察看特定感興趣的話題,剔除不相關(guān)的信息,并且囊括個人和數(shù)以百萬計的人員的情緒。這套工具可以從博客、Twitter、Facebook或其他有價值的公開的社交媒體網(wǎng)站上提取信息。它可以由分析人員設(shè)定,查詢特定的主題或關(guān)鍵詞,而且這套工具可以全天候工作。

“當(dāng)分析人員開始工作時,他們會得到最新的信息,并且全天持續(xù)更新,”加西亞說。

由SAS公司提供的解決方案還允許多個個體在相似感興趣的領(lǐng)域內(nèi)交換數(shù)據(jù)。隨著分析人員掌握接收到的信息是更貼近自身的需要,還是與他們所需要的信息有所偏離,他們可以在工具運行過程中進一步優(yōu)化搜索方法,對接收到數(shù)據(jù)實施進一步的管理。

“這套工具還有能力確定信息源的位置,”加西亞補充說,“SAS公司正在與AGI公司一起,在確認社交媒體用戶位置的基礎(chǔ)上,為用戶提供地理位置信息。這對于作戰(zhàn)人員來說具有重要意義,可用于評估部隊威脅,或營救陷于困境而無法利用傳統(tǒng)溝通渠道的人員。”

SAS可以分析28種本土語言的感情色彩,第29種語言——波斯語目前正在進行驗收測試。這些語言不會被翻譯成英語,而是以它們的母語形式進行評估,以提供更準確的情緒評分。“這對于評估可能的威脅非常關(guān)鍵,因為情緒的變化可能是細微的,”加西亞解釋說。

SAS正在與現(xiàn)有用戶合作,為那些需要得知有細微變化發(fā)生的用戶創(chuàng)建情緒狀態(tài)。

“對于一次單一的事件,一個人很難從非常積極的情緒變得非常消極,”她評論道,“因此情緒狀態(tài)可以針對一個主題,在一段時間內(nèi)評估目標對象觀點或情感的變化。這有助于別國人員更好地了解哪些行為或活動可以在本土民眾中產(chǎn)生一種積極或消極反應(yīng)。”

這樣做的目的是使軍隊成員在更深入了解平民文化,或在更深入了解他們過去對于與軍隊互動反應(yīng)的基礎(chǔ)上,與他們開展積極互動。

開源陷阱

開源數(shù)據(jù)的首要優(yōu)勢在于它的刷新速度。新的信息不斷涌現(xiàn)。同樣的道理,海量的可用數(shù)據(jù)也是一項挑戰(zhàn)。

“雖然正在研究使最終用戶面對的數(shù)據(jù)‘瘦身’的技術(shù),但每年的數(shù)據(jù)集成倍增長,所以,這些技術(shù)必須相應(yīng)做出調(diào)整,以跟上數(shù)據(jù)量增長的速度,”萊烏說。

此外,鑒于用戶在獲取技術(shù)上存在不對等,相對于文字信息,社交媒體未必會提供大范圍民眾有代表性的圖片。業(yè)界目前正在討論的一些具體問題包括多國外語分析,以及特定類型社交媒體的獨特特質(zhì)。

關(guān)于外語分析,用于推導(dǎo)主題的統(tǒng)計技術(shù)的基本水平是獨立于目標對象的語言。

“不過,在處理外語時肯定會有難題出現(xiàn),”麥科馬克說,“谷歌翻譯和雅虎!寶貝魚(Yahoo! BabelFish)之類的工具能夠就討論的問題為用戶提供一些粗略的認知,但不能表達更多更地道的語言上的細微差別。”

在整個自然語言處理界,這是一個較為活躍的研究領(lǐng)域。

媒體中拼寫的不同和詞匯的不同形式也帶來了巨大的挑戰(zhàn)。尤其是在Twitter中,錯誤的拼寫、縮略語和文體的拼寫變化,所有這些都使得標準的規(guī)范化技術(shù)難于實施。在這種情況下,自動化的集群技術(shù)變得十分必要。

加西亞補充說這當(dāng)中還存在其他問題,如個體如何在博客、Twitter或其他網(wǎng)站上創(chuàng)建新的身份。個人或團體可以在保密設(shè)置的基礎(chǔ)上隱藏他們的身份和位置信息。

“任何人都可以就其他人講述的事件或提出的主題發(fā)表自己的見解,但這些事件或見解未必都是準確或真實的,”她說,“如果發(fā)現(xiàn)這些評論甚至有部分失實,就需要對這些信息的來源進行查證并認真評估它可能造成的影響。”

在感知方面也存在挑戰(zhàn)。許多個體可能會目擊事件的發(fā)生,并且會基于他們的觀察角度和個人偏見使得感知非常不同。

加西亞指出,由于社交媒體是一種論壇,對于偏見、觀察角度或有意誤導(dǎo)沒有真正的過濾器,因此必須謹慎使用這樣一種強有力的工具。分析人員必須在自身經(jīng)驗、理解力和所學(xué)知識的基礎(chǔ)上做出有價值的判斷。社交媒體只是一種數(shù)據(jù)源,它并不比其他單一的數(shù)據(jù)來源更為精確。由于個體提供消息的可靠性無法保證,它可能更不明確。

“由于提供信息的人可能是這個世界上的任何一員,評論的真實性也如同這個星球上個人的誠實度一樣,存在很大的差異,因此仍要依賴于我們擁有正確解讀消息的能力,”她說。

未來的發(fā)展方向

萊烏預(yù)測,在下一個5年,隨著越來越多的用戶使用社交媒體開發(fā)作為一種信息搜集與分析的可行手段,會有大量新的工具和方法出現(xiàn),以便處理不斷增長的數(shù)據(jù)集。

希門尼斯聲稱,移動和社交應(yīng)用程序?qū)⒗^續(xù)增加,功能得到擴充的設(shè)備將繼續(xù)普及。

“實用功能會得到增強,如地理知識的補充——例如,你可以拿著自己的手機查看在一個特定方向上有哪些商店、飯店和/或設(shè)施——已經(jīng)出現(xiàn),但是隨著產(chǎn)業(yè)的發(fā)展與成熟,它們將變得更加準確與實用,”他說。

社交媒體也開始滲透到企業(yè)。各行機構(gòu)正在對內(nèi)并對外應(yīng)用社交工具,以更好地了解并打破阻礙經(jīng)濟增長與效率提高的孤島。經(jīng)歷了人口結(jié)構(gòu)變化并轉(zhuǎn)向年輕一代的機構(gòu)已經(jīng)接受了此類工具,將其作為一種參與途徑和溝通方式,這些機構(gòu)中的個體已經(jīng)適應(yīng)并理解了這種做法。

麥科馬克主張,隨著美國國防部和情報機構(gòu)轉(zhuǎn)向更多的開放資源分析,對于先進分析能力的需求將會增加,這些能力能夠解答一些戰(zhàn)略和戰(zhàn)術(shù)問題。

“在技術(shù)方面,我們將開始看到使用分布式和云計算技術(shù)處理大量實時流數(shù)據(jù)逐漸增多,”麥科馬克補充道,“從統(tǒng)計語言模型到動態(tài)趨勢分析模型,如何順應(yīng)分析技術(shù)的發(fā)展,對于這些環(huán)境,可能會是一個活躍的研究領(lǐng)域。”

最后,由于新生分析技術(shù)出現(xiàn),當(dāng)前工作大多集中于對社交媒體事件的回顧性分析上(如“阿拉伯之春”)。

“未來5年這些工具將經(jīng)歷真正的考驗,我們將看到在事件演變成昨天的新聞之前,它們能否有效預(yù)測社交媒體的走向,”他說。

知遠/鐵木編譯自美國《軍事信息技術(shù)》雜志2012年6月刊

轉(zhuǎn)載請注明:北緯40° » 美軍如何從社交媒體中提取情報

喜歡 (0)or分享 (0)
發(fā)表我的評論
取消評論
表情