亚洲a∨无码精品色午夜,四虎永久在线精品视频,少妇丰满大乳被男人揉捏视频,熟女少妇丰满一区二区,少妇无码av无码专区在线观看

推廣 熱搜: 湖北  加油站  山東  滿(mǎn)意度  汽車(chē)  就業(yè)質(zhì)量  大數(shù)據(jù)  移動(dòng)  重慶  房地產(chǎn) 

大數(shù)據(jù)與小數(shù)據(jù): 民族志學(xué)者和數(shù)據(jù)科學(xué)家如何合作?

日期:2016-02-04     瀏覽:557    下載:0     體積:1M     評(píng)論:0    

Notice: Undefined variable: description in D:\websoft\www\diaoyan\wwwroot\file\cache\tpl\default\chip\content.php on line 161












 2001年,維基百科剛剛創(chuàng)立的時(shí)候,提出了令人頗為激動(dòng)的目標(biāo)口號(hào):維基百科要為地球上的每一個(gè)人提供自由的百科全書(shū)——它是人們用自己選擇的語(yǔ)言書(shū)寫(xiě)的、全世界知識(shí)的總和。那個(gè)時(shí)候,Web2.0的概念還沒(méi)出現(xiàn),從來(lái)沒(méi)有人這么隆重地提出要集結(jié)面目模糊的普通人的智慧去解決普通人的問(wèn)題,而且方法如此巧妙。于是,這個(gè)公開(kāi)、免費(fèi)、純粹依靠自發(fā)群體協(xié)作,同時(shí)也有嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)要求的龐大知識(shí)系統(tǒng),也被人譽(yù)為“自由人的自由聯(lián)合”。

但是,正因?yàn)榫S基百科是開(kāi)放、自由的,就意味著誰(shuí)都可以編輯。那么既然有貢獻(xiàn)者,也就會(huì)有破壞者——萬(wàn)一許多人的智慧結(jié)晶在一夕盡毀怎么辦?2004年,IBM的一項(xiàng)研究卻發(fā)現(xiàn)了一些“神奇”的現(xiàn)象:維基百科遭遇的破壞,頻繁得令人吃驚,但多數(shù)破壞活動(dòng)5分鐘內(nèi)就能被修復(fù)。2005年,麻省理工大學(xué)另一項(xiàng)研究又發(fā)現(xiàn),對(duì)于維基百科內(nèi)容的大規(guī)模刪除,平均可以在2.8分鐘內(nèi)被修正。而如果破壞分子在完全刪除后再加上淫穢內(nèi)容,那么網(wǎng)頁(yè)被修復(fù)得更快——平均只要1.7分鐘。



我們并不知道是誰(shuí)修復(fù)了網(wǎng)頁(yè)——正如我們不知道是誰(shuí)破壞的、而當(dāng)初又是誰(shuí)貢獻(xiàn)的。以此類(lèi)推,在維基百科這個(gè)龐大的群體協(xié)作系統(tǒng)里面,還有很多運(yùn)作機(jī)制是我們不清楚的,比如都是些什么人熱衷于編輯詞條?他們的動(dòng)機(jī)是什么?人們編輯詞條的時(shí)候引證的信源從哪里來(lái)?出處是真實(shí)的嗎?符合維基百科對(duì)于學(xué)術(shù)的要求嗎?——這些問(wèn)題,也正是今天我們推送的文章作者——一位民族志(定性研究)專(zhuān)家和她的合作伙伴——一群數(shù)據(jù)科學(xué)家們所感興趣的。他們覺(jué)得,這些問(wèn)題的答案可能就隱藏在維基百科浩瀚的數(shù)據(jù)背后、最后能夠還原為一個(gè)個(gè)散落在世界各處的人的具體行為。然而,這些研究者各自的研究方法都無(wú)法完整地透視這些現(xiàn)象,于是他們打破方法上的“定性”和“定量”區(qū)隔,選擇并肩合作——并不是那種各自做各自的、最后把結(jié)果綜合起來(lái)的合作,而是——互相學(xué)習(xí)對(duì)方的方法,使用對(duì)方的方法,把對(duì)數(shù)據(jù)的分析和對(duì)人的理解真正結(jié)合起來(lái),以期獲得更廣闊的視域和更深刻的洞察。

聽(tīng)起來(lái)好像挺容易——但這意味著一個(gè)專(zhuān)家要去別人的領(lǐng)域里從小學(xué)生做起——這是需要勇氣的。不過(guò)他們覺(jué)得,為了興趣、為了對(duì)人類(lèi)現(xiàn)象更深刻的探尋,一切都是值得的。


這就是我們推薦這篇文章的原因。



民族志學(xué)者和數(shù)據(jù)科學(xué)家如何合作?
大數(shù)據(jù)與小數(shù)據(jù)

Heather Ford, University of Oxford, 1 St Giles, Oxford OX1 3JS, UK.
郵箱:heather.ford@oii.ox.ac.uk


摘要

近三年來(lái),民族志學(xué)家,同時(shí)也是在讀博士的希瑟•福特(Heather Ford)一直致力于一項(xiàng)特殊的合作項(xiàng)目。她與來(lái)自明尼蘇達(dá)州的兩位數(shù)據(jù)科學(xué)家戴夫•莫斯坎特(Dave Musicant )和佘蘭德•沈(Shilad Sen)合作,旨在對(duì)維基百科的來(lái)源進(jìn)行探究。在本文中,她提到他們?nèi)皇侨绾螐南嘧R(shí)到一起工作,以及在這段經(jīng)歷中的寶貴收獲。通過(guò)此項(xiàng)合作,有三個(gè)主題變得顯而易見(jiàn),而這也是他們合作成功的關(guān)鍵:數(shù)據(jù)科學(xué)家和民族志學(xué)家有很多共同之處;他們的研究方法是互補(bǔ)的;他們共同發(fā)掘數(shù)據(jù)而不是刻意區(qū)分研究任務(wù)。

關(guān)鍵詞

合作;跨學(xué)科;民族志學(xué)家;數(shù)據(jù)科學(xué);大數(shù)據(jù);研究方法


2011年7月,在加州山景城(Mountain View)召開(kāi)的開(kāi)放式協(xié)作聯(lián)合國(guó)際研討會(huì)(WikiSym)上,我認(rèn)識(shí)了來(lái)自明尼蘇達(dá)州的兩位計(jì)算機(jī)科學(xué)家。那時(shí)我以民族志學(xué)家的身份在非營(yíng)利性科技公司Ushahidi(一個(gè)免費(fèi)開(kāi)放資源的平臺(tái),是為了報(bào)道 2007 年肯尼亞一次有爭(zhēng)議選舉而創(chuàng)建的,允許用戶(hù)報(bào)道他們見(jiàn)證的新聞,然后把這些報(bào)道加載到一張?jiān)诰€地圖上,讓這些信息集中起來(lái))工作,也曾經(jīng)與計(jì)算機(jī)科學(xué)家在工具的構(gòu)建和設(shè)計(jì)方面有所合作,但從沒(méi)有參與過(guò)專(zhuān)門(mén)針對(duì)于研究本身的項(xiàng)目。之所以被邀請(qǐng)來(lái)到研討會(huì),是因?yàn)槲覀內(nèi)齻€(gè)都對(duì)維基百科的來(lái)源和引用有所研究。

最近我們正在爭(zhēng)論到底是誰(shuí)開(kāi)啟了這個(gè)話(huà)題。作為卡爾特大學(xué)(Carleton College)的計(jì)算機(jī)科學(xué)家,戴夫•莫斯坎特(Dave Musicant)說(shuō),他喜歡做跨學(xué)科研究,但總是羞于做自我介紹。佘蘭德•沈(Shilad Sen)是麥卡利斯特學(xué)院(Macalester College)計(jì)算機(jī)科學(xué)方向的助理教授,與戴夫共同致力于數(shù)據(jù)集的研究工作,此數(shù)據(jù)集包含大約350萬(wàn)維基百科中的6700萬(wàn)源發(fā)布。佘蘭德隨后大方寫(xiě)到:“當(dāng)你來(lái)找我們討論時(shí),我們的研究其實(shí)已經(jīng)陷入了停滯狀態(tài)。我們一直在做大數(shù)據(jù)分析,但卻不知道應(yīng)該如何處理這些數(shù)據(jù)。你救了我們!”

現(xiàn)在回想起來(lái),我們后來(lái)的合作在很大程度上可以說(shuō)是互相“拯救”。在研究過(guò)程中,我試圖描述維基人處理突發(fā)事件來(lái)源的方式,這有助于Ushahidi的軟件開(kāi)發(fā)工程,但對(duì)于指引新方向的維基百科源,我一直沒(méi)能找到一個(gè)更廣闊的視角來(lái)透視維基百科的信息來(lái)源。同時(shí)對(duì)于戴夫和佘蘭德來(lái)說(shuō),他們想搞清楚是否可以推測(cè)維基百科上持久性信源的特性,以此來(lái)開(kāi)發(fā)軟件工具,為維基人提供引文,但是關(guān)于信源應(yīng)用或刪除的依據(jù),他們并沒(méi)有一個(gè)詳細(xì)的方案。



接下來(lái)的兩年,我們?nèi)齻€(gè)每幾個(gè)月就在Skype上碰頭,分享各自的發(fā)現(xiàn),然后提出新的分析觀點(diǎn)。我們還徹底檢驗(yàn)了新的數(shù)據(jù)理論,最終在2013年為開(kāi)放式協(xié)作聯(lián)合國(guó)際研討會(huì)撰寫(xiě)出題為“到達(dá)信源(Getting to the source)”(福特等,2013)的論文。最近我去明尼蘇達(dá)州拜訪了他們二位,討論研究的未來(lái)發(fā)展方向,但合作形式將繼續(xù)保持非正式性和獨(dú)特性。盡管如此(或者說(shuō)正因?yàn)槿绱耍?,和他們二位的合作成為我早期研究生涯中一段非常愉快和有教育意義的經(jīng)歷。在我看來(lái),原因在于一方面我們?cè)诤献髦行愿裣嗤?,相處融洽,另一方面,擁有不同認(rèn)知論和方法論的研究者在這種跨學(xué)科合作中,如果一直保持開(kāi)放和創(chuàng)造性的思維方式,總會(huì)碰撞出不一樣的火花,得到令人興奮的研究成果。這里有三個(gè)特別值得注意的觀察結(jié)果:數(shù)據(jù)科學(xué)家和民族志學(xué)者有很多共同之處;他們的研究方法是互補(bǔ)的;他們共同發(fā)掘數(shù)據(jù)而不是刻意劃分研究任務(wù)。


民族志學(xué)家和數(shù)據(jù)科學(xué)家有很多共同之處

雖然乍看之下,大數(shù)據(jù)研究和人種學(xué)南轅北轍(畢竟,民族志學(xué)家擁有的研究基礎(chǔ),是建立在與當(dāng)代媒介化社會(huì)截然不同的社會(huì)中的)。但是,它們之間確實(shí)具有顯著的共性。兩門(mén)學(xué)科都承認(rèn),人類(lèi)的行為(比起言語(yǔ))是非常重要的研究對(duì)象,并且如果想深入理解研究課題,對(duì)數(shù)據(jù)的探索是必不可少的。正如珍娜•伯勒爾(Jenna Burrell)(2012)在《民族志概況 》(Ethnography Matters)中所寫(xiě):民族志學(xué)家采用勞動(dòng)密集型的方式,通過(guò)出門(mén)采集,接觸第一手的資料來(lái)獲取信息。而研究大數(shù)據(jù)的專(zhuān)家卻不同,他們研究出捕獲短暫行為的方法。指的就是,某人點(diǎn)擊鏈接,設(shè)置個(gè)人偏好,在特定時(shí)間內(nèi)從一個(gè)無(wú)線接入點(diǎn)轉(zhuǎn)到另一個(gè)等相關(guān)行為。伯勒爾認(rèn)為,民族志學(xué)家和數(shù)據(jù)科學(xué)家只是在研究人類(lèi)行為上的側(cè)重不同。例如,從現(xiàn)場(chǎng)對(duì)話(huà)和正式訪談中,民族志學(xué)家做了許多輔助性工作,將顯性行為和隱性含義聯(lián)系起來(lái),而另一方面,數(shù)據(jù)科學(xué)家更傾向于進(jìn)行行為數(shù)據(jù)的跟蹤。



然而,如果配合默契,民族志學(xué)家和數(shù)據(jù)科學(xué)家將攜手共進(jìn),共同找尋出普通問(wèn)題的解決方案,進(jìn)而展開(kāi)更廣泛(在數(shù)據(jù)科學(xué)領(lǐng)域)和更深入(在人種學(xué)領(lǐng)域)的研究。在“到達(dá)信源”的合作中,我們?nèi)齻€(gè)人都懷有對(duì)維基百科信源的好奇,以及——在更廣泛的層面上——對(duì)維基百科運(yùn)作模式的好奇,而正是這份共同的好奇心推動(dòng)了研究的進(jìn)展。我對(duì)維基百科“批量處理信源的方式很感興趣,我也曾經(jīng)查閱過(guò)維基百科的相關(guān)政策,發(fā)現(xiàn)實(shí)際采用信源的方式和政策上所建議的非常不同。我好奇的是,信源選擇的狀況是否與政策上“學(xué)術(shù)源居多”的描述相矛盾。為了看看我的發(fā)現(xiàn)是否體現(xiàn)了更明顯的趨勢(shì),我需要著手研究關(guān)于數(shù)據(jù)跟蹤的整個(gè)語(yǔ)料庫(kù)。佘蘭德和戴夫?qū)π旁吹恼硿愿信d趣,他們致力于探索某些信源在維基百科上長(zhǎng)盛不衰的原因。因此,對(duì)他們來(lái)說(shuō),信源采集的過(guò)程,對(duì)于理解和評(píng)估數(shù)據(jù)庫(kù)中數(shù)據(jù)的流動(dòng)路徑至關(guān)重要。我們認(rèn)識(shí)到,相互分享各自不同領(lǐng)域的研究方法和知識(shí),大家都將會(huì)受益匪淺。我需要學(xué)習(xí)分析整個(gè)語(yǔ)料庫(kù)的方法,而他們需要了解維基百科的日常實(shí)踐操作。

結(jié)果表明,除了一些常見(jiàn)問(wèn)題和需要共享的專(zhuān)業(yè)知識(shí),我們還擁有了研究方法上的共性。剛開(kāi)始和佘蘭德、戴夫一起工作時(shí),我便驚喜地發(fā)現(xiàn)我們都傾向于運(yùn)用歸納性(對(duì)我們研究中數(shù)據(jù)的理論進(jìn)行檢測(cè)),系統(tǒng)性(就所提供線索繼續(xù)追查,質(zhì)疑之前的假設(shè)),以及合作性(平等地?fù)?dān)負(fù)責(zé)任,共同做決定,明確這些決策對(duì)整個(gè)項(xiàng)目產(chǎn)生的影響)強(qiáng)的研究方法。在開(kāi)展此項(xiàng)合作之前,我認(rèn)為,定量研究已經(jīng)被廣泛運(yùn)用 ,而定量研究人員如果再與定性研究人員合作,將收效甚微。但是,和戴夫、佘蘭德一起工作時(shí),我發(fā)現(xiàn)我們有很多共同之處,這種合作會(huì)給數(shù)據(jù)科學(xué)家和民族志學(xué)家兩方都帶來(lái)有價(jià)值的成果。


我們的技能和經(jīng)驗(yàn)具有互補(bǔ)性



在維基百科研究的舞臺(tái)之上,一些大數(shù)據(jù)研究者采用訪談、參與觀察、編碼等方法,通過(guò)大規(guī)模分析來(lái)探索研究問(wèn)題。例如,布萊恩•基根(Brian Keegan)的體系內(nèi)大規(guī)模網(wǎng)絡(luò)路徑分析(large-scale network analyses of traces through a system)(基根等,2012)便是大數(shù)據(jù)研究的典范,然而他依然花費(fèi)大量的時(shí)間參與維基百科內(nèi)容的分類(lèi)生產(chǎn)之中,通過(guò)在這個(gè)領(lǐng)域的學(xué)習(xí),他更加了解到所收集的數(shù)據(jù)路徑的含義。然而,很少有像基根這樣的研究者,運(yùn)用所掌握的多種必要的研究方法,試圖解答我們這個(gè)時(shí)代的重要問(wèn)題?,F(xiàn)實(shí)中更常見(jiàn)的則是各種類(lèi)型的合作,研究者們擁有多種專(zhuān)業(yè)研究技能和認(rèn)知論,一起工作,為研究提供更廣泛的視角。研究者們相互學(xué)習(xí),通過(guò)掌握自身并不熟悉的研究方法,不斷提升技能,積累經(jīng)驗(yàn)。

在此項(xiàng)關(guān)于維基百科來(lái)源研究的合作之中,戴夫和佘蘭德有足夠的能力和資源來(lái)提取350萬(wàn)維基百科中的6700萬(wàn)源發(fā)布。我在進(jìn)行訪談后發(fā)現(xiàn),維基人從百科全書(shū)中選取、記錄信息源,因此,我提出分割數(shù)據(jù)的不同方法,以助于構(gòu)建起一個(gè)嶄新的視野。戴夫和佘蘭德使用復(fù)雜軟件和數(shù)據(jù)加工軟件來(lái)處理龐大的數(shù)據(jù),而我更了解維基百科的實(shí)際操作,提供一些進(jìn)行數(shù)據(jù)選擇的分析方式。例如,一個(gè)被訪的專(zhuān)家曾說(shuō),維基人經(jīng)常通過(guò)本地來(lái)源獲取信息,但卻標(biāo)注上西方來(lái)源,因此我們可以同地理相出處相聯(lián)系,來(lái)探究信源的多樣性。通過(guò)理解這種做法,我們可以發(fā)現(xiàn)在利用數(shù)據(jù)的過(guò)程中丟失了什么,也就是說(shuō),編輯們?cè)谳斎刖S基百科的引用時(shí),并沒(méi)有標(biāo)注出自己獲取信息的實(shí)際位置,而是展現(xiàn)了他們自以為讀者認(rèn)可的出處。這個(gè)小細(xì)節(jié)對(duì)于我們總結(jié)來(lái)源和引用所展現(xiàn)的內(nèi)容,以及在類(lèi)似于維基百科的大眾群體信息生產(chǎn)社區(qū)開(kāi)展合作的需求,具有重要的含義。經(jīng)過(guò)反復(fù)討論,我與戴夫、佘蘭德最終找到一些驗(yàn)證假設(shè)的方法,發(fā)展出了分析數(shù)據(jù)的不同視角 。我們都承認(rèn),在整個(gè)過(guò)程中,我們之間的能力和經(jīng)驗(yàn)具有很強(qiáng)的互補(bǔ)性。


共同發(fā)掘數(shù)據(jù)比區(qū)分任務(wù)效果更好



許多合作研究失敗的原因在于,按照不同類(lèi)型、研究所認(rèn)可的技能和專(zhuān)業(yè)知識(shí)來(lái)分配任務(wù),而不是為研究設(shè)計(jì)一個(gè)更具創(chuàng)造性的方法。在這種傳統(tǒng)觀念影響下,民族志學(xué)家可能被要求去做訪談和人工編碼,而大數(shù)據(jù)分析師只能在沒(méi)有合作和研究經(jīng)驗(yàn)分享的前提下,進(jìn)行數(shù)據(jù)的大規(guī)模分析。結(jié)果就是,他們彼此之間并沒(méi)有共享技能:數(shù)據(jù)科學(xué)家僅僅被當(dāng)作操控?cái)?shù)據(jù)的技術(shù)人員,而民族志學(xué)家扮演了用所寫(xiě)東西進(jìn)行填充內(nèi)容的角色。如果兩類(lèi)研究者希望不斷積累經(jīng)驗(yàn),相互借力獲得高質(zhì)量的研究成果,那么雙方就都需要承擔(dān)非熟悉領(lǐng)域的相關(guān)任務(wù),或者至少全程參與某個(gè)特定數(shù)據(jù)的發(fā)掘過(guò)程。

盡管我自己就可以對(duì)項(xiàng)目的信息來(lái)源進(jìn)行人工編碼,但戴夫和佘蘭德還是承擔(dān)了一部分任務(wù),最終我們每個(gè)人都對(duì)編碼計(jì)劃的發(fā)展有所貢獻(xiàn)。在完成了自己的任務(wù)后,我們還相互檢查彼此的編碼,以確保其精確性。我是編碼計(jì)劃的主管,但戴夫和佘蘭德也會(huì)對(duì)我在項(xiàng)目的定義方面提出質(zhì)疑,幫助我手工編碼隨機(jī)樣本,以及檢查我的編碼結(jié)果。通過(guò)這種方式,我們每個(gè)人都對(duì)項(xiàng)目本身和研究方法有了更深刻的理解——眾所周知,在研究方法的實(shí)踐過(guò)程中,我們所選擇的特定的視角,會(huì)顯著影響研究結(jié)果的產(chǎn)出形態(tài)。 我學(xué)會(huì)了大規(guī)模數(shù)據(jù)分析的操作方法,以及在獲得特定結(jié)果過(guò)程中進(jìn)行選擇的方式。另一方面,佘蘭德已經(jīng)開(kāi)始把我們共同開(kāi)發(fā)出的編碼方案,作為在麥卡利斯特學(xué)院方法課上的案例給學(xué)生講解。在整個(gè)項(xiàng)目的開(kāi)展過(guò)程中,我們都竭盡全力,分擔(dān)非熟悉領(lǐng)域的任務(wù),當(dāng)然,和只完成自己所擅長(zhǎng)領(lǐng)域的工作相比,收獲也更多。

總之,民族志學(xué)家從大數(shù)據(jù)來(lái)源的分析中收獲頗多,他們擁有獨(dú)特的視角,通過(guò)補(bǔ)充性的觀察,可以發(fā)現(xiàn)參與者在媒體平臺(tái)上互動(dòng)的方式。相反,數(shù)據(jù)科學(xué)家從定性研究的角度,獲取缺失數(shù)據(jù)、不完整數(shù)據(jù)的含義,探索數(shù)據(jù)追蹤產(chǎn)生的社會(huì)意義。在合作中,民族志學(xué)家和數(shù)據(jù)科學(xué)家不僅得到了更加嚴(yán)謹(jǐn)?shù)难芯砍晒?,而且發(fā)掘出了更多的研究技能。通過(guò)此次合作,我對(duì)定量研究的良好效果贊嘆不已。這段經(jīng)歷再次印證了那句話(huà):無(wú)論我們管自己叫“定性研究者”還是“定量研究者”,一項(xiàng)好的研究都不會(huì)因此而受到影響。


參考文獻(xiàn)

1.Burrell J (2012) The ethnographer’s complete guide to big data: Answers.Ethnography Matters. Available at:www.ethnographymatters.net/blog/2012/06/11/the-ethnographers-complete-guide-to-big-data-part-ii-answers/ (accessed 9 July 2014).

2.Ford H, Sen S, Musicant DR, et al. (2013) Getting to the source: wher does Wikipedia get its information from? In: Proceedings of the 9th international symposium on open collaboration. New York, NY: ACM, pp. 9:1–9:10. doi:10.1145/2491055.2491064.

3.Keegan B, Gergle D and Contractor N (2012) Do editors or articles drive collaboration? Multilevel statistical network analysis of Wikipedia coauthorship. In:Proceedings of the ACM 2012 conference on computer supported cooperative work. New York, NY: ACM, pp. 427–436. doi:10.1145/2145204.2145271



原文鏈接:http://bds.sagepub.com/content/1/2/2053951714544337.full.pdf+html

本文由北京大學(xué)社會(huì)化媒體研究中心官方微信平臺(tái)“數(shù)洞社媒”獨(dú)家編譯,轉(zhuǎn)載請(qǐng)注明出處。
打賞
0相關(guān)評(píng)論
本類(lèi)推薦
下載排行
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系我們  |  加入我們  |  認(rèn)證企業(yè)  |  付款方式  |  友情鏈接  |  使用協(xié)議  |  版權(quán)隱私  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  京ICP備15049263號(hào)
Processed in 1.734 second(s), 555 queries, Memory 6.68 M