杭州網(wǎng)站設(shè)計(jì):搜狗搜索事業(yè)部總經(jīng)理:從識(shí)圖搜索談未來大勢(shì)
分享 2011.08.30 瀏覽次數(shù):7099次
搜狗搜索事業(yè)部總經(jīng)理:從識(shí)圖搜索談未來大勢(shì)
經(jīng)過近半年的獨(dú)立研發(fā),搜狗搜索推出了識(shí)圖搜索功能,即可通過上傳圖片等方式搜索找到相似群組圖片和資料。日前,就這一新功能以及搜索領(lǐng)域熱點(diǎn)話題,CSDN記者專訪了搜狗公司搜索事業(yè)部總經(jīng)理茹立云。
搜狗公司搜索事業(yè)部總經(jīng)理茹立云
關(guān)鍵詞:杭州網(wǎng)站建設(shè)
深度調(diào)研和數(shù)據(jù)挖掘用戶需求
CSDN記者:請(qǐng)談?wù)勊压纷鲎R(shí)圖搜索功能的初衷是什么?
搜狗公司搜索事業(yè)部總經(jīng)理茹立云:主要基于用戶需求的轉(zhuǎn)變,包括兩個(gè)層面。第一個(gè)層面是整個(gè)互聯(lián)網(wǎng)技術(shù)都在提升,用戶背后的需求一直得不到滿足,以前大家搜索主要靠文字,隨著時(shí)代的進(jìn)步,媒介使用設(shè)備的更新,用戶對(duì)基于圖片、音頻、視頻等跨媒體搜索需求越來越大。比如說,在搜狗的搜索引擎里面,過去搜一張圖片是誰,會(huì)有1000萬以上的結(jié)果。到現(xiàn)在,更多用戶不再滿足于僅僅看到圖片,而想了解圖片背后的故事是什么。第二,隨著新興媒體的誕生,像微博,對(duì)識(shí)圖搜索的需求越來越大,用戶想知道要加的這個(gè)人是不是真實(shí)的那個(gè)人,包括北京下暴雨網(wǎng)上出現(xiàn)了大量通過PS出來的虛假圖片,還有動(dòng)車事故也有很多虛假的圖片,廣大網(wǎng)友難辨真?zhèn)危砸黾颖鎰e能力,識(shí)圖技術(shù)就可以辨別事情的真?zhèn)?。此外,我們也考慮到了搜狗的優(yōu)勢(shì),識(shí)圖能夠更加便捷,搜狗通過跟瀏覽器結(jié)合,用戶使用識(shí)圖越來越方便。
記者:當(dāng)時(shí)開發(fā)識(shí)圖搜索功能的時(shí)候搜狗團(tuán)隊(duì)內(nèi)部有沒有一些分歧?
茹立云:初期做了比較多的調(diào)研,最主要的調(diào)研包括三個(gè)方面:1.首先是用戶的潛在需求到底會(huì)有多大,這個(gè)我們對(duì)相關(guān)數(shù)據(jù)做了挖掘和分析;2.另外就是調(diào)研了識(shí)圖或者圖片相關(guān)技術(shù),要支撐這么一個(gè)識(shí)圖的產(chǎn)品在技術(shù)層面是不是成熟;3.同時(shí)現(xiàn)在用戶使用的話是不是便捷,如何能夠給用戶提供更好的體驗(yàn)。通過調(diào)研,搜狗發(fā)現(xiàn),一旦發(fā)現(xiàn)用戶背后的需求非常巨大,做這么一個(gè)產(chǎn)品自然而然成為大家的共識(shí)。一開始討論比較多的是用什么樣的技術(shù)方案研發(fā)出來,并且能夠很好的做好。但是對(duì)于這個(gè)功能,我們內(nèi)部是一直看好的。
記者:與Google推出的識(shí)圖搜索功能相比如何?
茹立云:搜狗的識(shí)圖搜索跟Google比較有幾個(gè)比較重大的創(chuàng)新,我們發(fā)現(xiàn)用戶在之前的識(shí)圖需求里面,除了想找到跟這張圖片及文化一樣的圖片之外,很多同組的圖片可能也是他感興趣的,比如說搜一張搞笑的圖片,能不能把其他的搞笑的圖片搜在一起。搜狗已經(jīng)不僅僅是基于圖像的內(nèi)容,同時(shí)把它文字上的含義,或者說它的語意結(jié)合在一起,找到同組合的圖片,這是一個(gè)創(chuàng)新。第二塊兒就是發(fā)現(xiàn)用戶在使用識(shí)圖的時(shí)候,如果單純用一種網(wǎng)絡(luò)服務(wù)的形式的話,使用環(huán)節(jié)會(huì)非常不便利,但是如果把它和瀏覽器很好的緊密結(jié)合在一起,使用識(shí)圖的過程就變得特別簡(jiǎn)單了,隨時(shí)隨地都可以識(shí)圖,不用像之前要記住這個(gè)網(wǎng)址,拷下來輸進(jìn)去。
關(guān)鍵詞:杭州網(wǎng)站制作
技術(shù)門檻較高 在微博領(lǐng)域可發(fā)揮大作用
記者:采訪之前,我也找業(yè)界的人咨詢了識(shí)圖搜索技術(shù),據(jù)說難度非常大。能否用通俗的語言解釋一下技術(shù)上的實(shí)現(xiàn)方式?
茹立云:搜狗識(shí)圖主要包括以下幾個(gè)技術(shù):
首先,圖像有效特征的抽取。有一句話叫做“一圖勝千言”,圖片包含了大量的語意,是用各種各樣的顏色、紋理特征表現(xiàn),怎樣能夠找到一種有效地特征來描述,對(duì)圖像壓縮、變形、光照的變化都不會(huì)受它的影響,這些特征不是搜狗定的,這是里面比較困難的點(diǎn),就是圖像有效特征的抽取。
其次,要抽取這個(gè)特征的話怎么把它理想化,一旦理想化之后才可能成為一種索引,否則就沒有辦法進(jìn)行索引,后續(xù)的效力就沒有辦法得到保證。搜狗對(duì)識(shí)圖效果的要求非常高,一張圖在匹配這塊兒要求在10秒以內(nèi)把結(jié)果反饋回來,有效特征的表示是其中一大難點(diǎn),以及怎么樣建立一個(gè)索引。
第三,去偽存真。有了大量跟當(dāng)前圖片類似的圖片,怎么樣從里面能夠提取出表示這個(gè)圖片含義的語意,現(xiàn)在中文互聯(lián)網(wǎng)的情況比外文互聯(lián)網(wǎng)的情況復(fù)雜很多,比如說很多明星的照片,比如說減肥,都會(huì)被網(wǎng)上盜用,怎么能夠去偽存真,真正找到這張圖對(duì)應(yīng)的是誰。
第四,搜狗做了同主題圖片的識(shí)別。有別于之前一般的做法,僅僅根據(jù)圖片的特征和語意,搜狗技術(shù)還用到了圖片之間的鏈接關(guān)系,怎么樣能夠把這種鏈接的關(guān)系應(yīng)用起來,同時(shí)提高識(shí)圖的精度。
記者:我們?cè)趫D片上可能會(huì)存在一些關(guān)鍵字或敏感詞,能否對(duì)這些關(guān)鍵詞進(jìn)行識(shí)別?
茹立云:從技術(shù)上來講,如果不是手寫的話,印刷體內(nèi)容的識(shí)別技術(shù)是非常成熟的,在90年代末的時(shí)候,OCR(Optical Character Recognition光學(xué)字符識(shí)別)的技術(shù)已經(jīng)非常成熟,里面唯一有困難的是怎么樣對(duì)圖片進(jìn)行切割。所以O(shè)CR的技術(shù)本身是非常成熟的,另外搜狗目前還沒有應(yīng)用,但是搜狗這塊兒技術(shù)有儲(chǔ)備,我們跟清華有聯(lián)合實(shí)驗(yàn)室,在90年代末的時(shí)候基本上已經(jīng)可以做到極致了。之前的四庫(kù)全書的數(shù)字化已經(jīng)做到了這個(gè)工作,現(xiàn)在我們會(huì)看到微博上有印刷體的圖,印刷體的識(shí)別現(xiàn)在是非常成熟的技術(shù)。
記者:現(xiàn)在微博上需要進(jìn)行關(guān)鍵字審核,很多人可以先發(fā)內(nèi)容,然后再截一張圖下來。這樣基于圖的內(nèi)容審核會(huì)比較麻煩。
茹立云: 對(duì)。這個(gè)不在于識(shí)圖,在監(jiān)控里面如果有這種需求,已經(jīng)有非常成熟的技術(shù),基本上國(guó)內(nèi)的高校都有這樣的技術(shù)。
記者:搜狗的識(shí)圖搜索技術(shù)在業(yè)內(nèi)是什么樣的水平?
茹立云:之前我們也做過精度測(cè)試,都不遜于當(dāng)前任何主流的識(shí)圖產(chǎn)品,另外在信息的及時(shí)度上,當(dāng)天出現(xiàn)的熱點(diǎn),當(dāng)天能否搜索出來,搜狗可以當(dāng)天搜索出來,但是我們看到其他的同類產(chǎn)品還不支持(到這個(gè)及時(shí)度)。圖像這塊兒搜狗在搜索引擎領(lǐng)域有7年的積累,在圖像技術(shù)上不能說比別人一定強(qiáng),但是不會(huì)比其他家落后,現(xiàn)在大概是這個(gè)情況。整個(gè)研發(fā)到最后推出與創(chuàng)新點(diǎn)結(jié)合在一起,速度非常迅速。
任何有道德的公司都不會(huì)去觸犯保護(hù)用戶隱私的底線
記者:網(wǎng)上有些圖片是有所有權(quán),搜狗識(shí)圖是怎么處理的?
茹立云:現(xiàn)在對(duì)于互聯(lián)網(wǎng)來講,圖片搜索還沒法辨別它是不是有所有權(quán),什么人擁有這個(gè)所有權(quán),要通過投訴的渠道。另外,會(huì)做一些比較敏感的圖片的過濾。
記者:如何看待識(shí)圖搜索可能會(huì)涉及用戶個(gè)人隱私的問題?
茹立云:據(jù)現(xiàn)在的了解,之前也跟國(guó)內(nèi)的圖像權(quán)威人士做了比較多的交流,基于頭像識(shí)別的技術(shù),或者人臉識(shí)別的技術(shù)在開放性方面是不完備的,效果有待于進(jìn)一步提升。首先在技術(shù)上這個(gè)門檻還沒有跨越;其次就是保護(hù)層面,由于技術(shù)的不成熟,用人臉識(shí)別這種方式的話,本身這種擔(dān)心是有必要的,但是也并不是非常有必要的事情。作為任何一家有社會(huì)責(zé)任的公司,推出任何可能涉及隱私產(chǎn)品的時(shí)候,一方面要多聽一聽公眾的意見,都不會(huì)去侵犯這個(gè)底線,隱私是需要保護(hù)的。另外一方面需要通過一些技術(shù)手段或者其他一些手段能夠保護(hù)用戶的隱私。
記者:但是普通的用戶并不是很了解,他們就覺得隱私被侵犯了。
茹立云:現(xiàn)在搜狗的識(shí)圖搜索技術(shù)還不會(huì)用人臉識(shí)別的技術(shù)在里面。
記者:您對(duì)目前搜索市場(chǎng)怎么看?尤其是國(guó)內(nèi),百度基本處于壟斷地位,你對(duì)搜狗的未來是如何規(guī)劃的?
推薦和整合功能是關(guān)鍵
茹立云:對(duì)搜索引擎市場(chǎng)來講,其實(shí)現(xiàn)在還是處于蓬勃發(fā)展的階段,無論是全球范圍內(nèi)還是中國(guó)范圍內(nèi),市場(chǎng)的潛力還是非常巨大的,尤其是國(guó)內(nèi)市場(chǎng)潛力更加巨大,主要是幾方面。
第一,國(guó)內(nèi)的網(wǎng)民還在繼續(xù)增長(zhǎng),不只在說PC端,無線端也在高速成長(zhǎng)。
第二,中國(guó)有2000萬家中小企業(yè),現(xiàn)在進(jìn)行互聯(lián)網(wǎng)營(yíng)銷的有20幾萬家,規(guī)模跟國(guó)際上比起來還小很多,整個(gè)中國(guó)的經(jīng)濟(jì)處于高速的發(fā)展中,互聯(lián)網(wǎng)以及電子商務(wù)在不斷地普及,從企業(yè)需要營(yíng)銷的方面來講未來也會(huì)有很大的增長(zhǎng)。整個(gè)行業(yè)處于比較好的發(fā)展時(shí)期,當(dāng)然現(xiàn)在也面臨一些問題,比如說搜索引擎在互聯(lián)網(wǎng)上營(yíng)銷的控制可能是其中的一個(gè)問題,不能讓一些虛假的廣告?zhèn)Φ接脩?,所以這也是大家盡力去解決的事情。
具體到搜狗來說,里面的機(jī)會(huì)在于:
第一,我們有跟客戶端,瀏覽器有協(xié)同作戰(zhàn)的做法,在用戶入口方面有優(yōu)勢(shì)。
第二,搜狗搜索有比較多的技術(shù)創(chuàng)新,像剛才提到的識(shí)圖搜索,以及前期提到的全搜索技術(shù)。用戶在使用搜索的時(shí)候更加便捷、全面、及時(shí)。通過入口的把握以及對(duì)產(chǎn)品的創(chuàng)新使得用戶越來越多的用搜狗并且喜歡搜狗,這也是過去的一年我們?yōu)槭裁磿?huì)這么快速成長(zhǎng)的原因之一。
另外,未來搜狗會(huì)更多的探索瀏覽器跟搜索結(jié)合的搜索模式,現(xiàn)在的搜索還是稱作為第二代搜索,那么第三代搜索需要轉(zhuǎn)變一種形式,不再像現(xiàn)在這樣簡(jiǎn)單的關(guān)健詞搜索,是一種無處不在的搜索,用戶要看到一篇新聞的時(shí)候,搜索引擎可以告訴你背后是什么,給你推薦相關(guān)的內(nèi)容,從整個(gè)互聯(lián)網(wǎng)發(fā)展來講,第一代是瀏覽器,第二代是搜索,第三代我們把它稱為總推薦,其實(shí)是搜索的延伸。搜狗未來希望在這個(gè)領(lǐng)域做出比較大的創(chuàng)新性的產(chǎn)品出來,搜索不再像現(xiàn)在靠關(guān)健詞做的搜索,可以把它稱為探索式的搜索,用戶看這篇文章背后的需求是什么,我可以告訴你進(jìn)一步你想做的一些什么事情。
記者:搜狗搜索跟瀏覽器整合,目前大概的進(jìn)展是什么樣的?
茹立云:目前我們已經(jīng)在做這個(gè)層面的整合,像識(shí)圖功能通過跟瀏覽器結(jié)合,使得用戶使用的便捷和體驗(yàn)有非常好的提升。另外,之前的消息盒子會(huì)做視頻的推薦,比如說用戶看過某一個(gè)連續(xù)劇,這是一個(gè)更新的連續(xù)劇,如果有新的出現(xiàn)的話,將第一時(shí)間推薦給你,不需要用戶自己不停的搜索看看有沒有新的,是這種推薦的概念。像音樂搜索,也會(huì)搜索頁面上是不是存在一些應(yīng)用,如果你感興趣的直接就可以在頁面上應(yīng)用,會(huì)非常的便捷。未來像電子商務(wù)、軟件、旅游酒店這塊兒都會(huì)跟推薦引擎結(jié)合在一起。
標(biāo)簽:杭州精品網(wǎng)站設(shè)計(jì)
興趣為先 扎實(shí)基本功最重要
記者:對(duì)于一些想進(jìn)入搜索領(lǐng)域的學(xué)生或技術(shù)人士,您有什么建議?
茹立云:想跨入搜索領(lǐng)域有很多種方式,本身跟搜索相關(guān)的領(lǐng)域要有特別全面的人才,比如說是一個(gè)技術(shù)人員的話,基本功一定要扎實(shí),比如說編程基本功打好了,才能夠做很多比較高深尖的技術(shù)。此外,還要選好入門搜索引擎領(lǐng)域的方向,如果本身對(duì)互聯(lián)網(wǎng)的產(chǎn)品非常喜歡,就可以做跟產(chǎn)品相關(guān)的工作。如果對(duì)網(wǎng)民這塊兒有感覺,跟他們聯(lián)絡(luò)有感覺,你就可以做產(chǎn)品應(yīng)用的工作,搜索引擎這個(gè)行業(yè)出來的人才是多種多樣的,關(guān)鍵是你是不是對(duì)這個(gè)感興趣,只要感興趣并且有基礎(chǔ),又為之去努力,做這個(gè)行業(yè)并不是太難的事情。
記者:技術(shù)人員的基本功具體包括哪些部分?
茹立云:這跟計(jì)算機(jī)科學(xué)的基礎(chǔ)技術(shù)比較相關(guān),比如說像操作系統(tǒng)、編程基礎(chǔ)課程等等。你想在里面有更進(jìn)一步的發(fā)展,最好還要會(huì)編程語言處理、自然語言處理、技術(shù)學(xué)識(shí)這些計(jì)算機(jī)領(lǐng)域的專長(zhǎng)。
備注:
關(guān)于搜狗識(shí)圖搜索:能實(shí)現(xiàn)以圖搜圖,即通過上傳圖片、鼠標(biāo)拖拽、鼠標(biāo)選圖、輸入圖片URL地址等多種方式搜索,找到互聯(lián)網(wǎng)上與這張圖片相似的其他圖片,并且利用圖片識(shí)別技術(shù),進(jìn)一步分析圖片內(nèi)容的主題,找到與這張圖片同主題的其他圖片。
關(guān)鍵詞:杭州精典網(wǎng)站制作
-
杭州網(wǎng)站設(shè)計(jì)公司:品牌網(wǎng)站開發(fā)助力企業(yè)成長(zhǎng)
日期:2024-12-20瀏覽次數(shù):823次
-
杭州網(wǎng)站建設(shè)公司:商城網(wǎng)站建設(shè)的六大關(guān)鍵步驟
日期:2024-12-18瀏覽次數(shù):865次
-
杭州網(wǎng)站制作:醫(yī)院網(wǎng)站設(shè)計(jì)與域名備案的復(fù)雜性探討
日期:2024-12-18瀏覽次數(shù):856次
-
杭州網(wǎng)站制作公司:打造安全可靠的醫(yī)院網(wǎng)站
日期:2024-12-11瀏覽次數(shù):1021次
-
杭州網(wǎng)站設(shè)計(jì)公司:數(shù)據(jù)庫(kù)在高端網(wǎng)站制作中的關(guān)鍵作用
日期:2024-12-11瀏覽次數(shù):992次
相關(guān)新聞
整合同類新聞,相關(guān)新聞一手掌握
-
萊蕪定制app和定制小程序,哪個(gè)更值得?
日期:2020-11-12瀏覽次數(shù):2153次
-
帶你了解萊蕪直播app開發(fā)
日期:2020-11-12瀏覽次數(shù):2096次
-
帷拓科技為你總結(jié)萊蕪網(wǎng)站制作要點(diǎn)
日期:2020-09-29瀏覽次數(shù):2122次
-
萊蕪網(wǎng)站建設(shè)之門戶網(wǎng)站
日期:2020-09-29瀏覽次數(shù):2117次
最新新聞
與互聯(lián)網(wǎng)同行,實(shí)時(shí)掌握網(wǎng)建行業(yè)最新動(dòng)態(tài)
-
網(wǎng)絡(luò)營(yíng)銷推廣效果越來越差?可能有這三個(gè)原因
日期:2020-01-13瀏覽次數(shù):5346次
-
微信小程序開發(fā)時(shí),如何做可以少走彎路
日期:2020-05-12瀏覽次數(shù):5286次
-
杭州網(wǎng)站設(shè)計(jì),首先要明白建設(shè)目的
日期:2020-07-28瀏覽次數(shù):4601次
-
選擇杭州網(wǎng)站建設(shè)公司,本地公司最好
日期:2021-07-07瀏覽次數(shù):3782次
-
杭州集團(tuán)網(wǎng)站建設(shè),需要注意哪些問題
日期:2023-01-30瀏覽次數(shù):2609次
隨機(jī)新聞
新聞新動(dòng)態(tài),您需要的新聞管家
洞悉市場(chǎng)趨勢(shì)演變讓傳播回歸社會(huì)
免費(fèi)獲取網(wǎng)站建設(shè)與網(wǎng)絡(luò)推廣方案報(bào)價(jià)
-
關(guān)于我們
杭州帷拓科技有限公司,是一家新型的全案網(wǎng)絡(luò)開發(fā)公司,作為以互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開發(fā)、小程序開發(fā)為核心的專業(yè)網(wǎng)絡(luò)技術(shù)服務(wù)供應(yīng)商,帷拓科技致力于全面分析市場(chǎng)環(huán)境、衡量與預(yù)測(cè)市場(chǎng)需求、整合區(qū)別于行業(yè)競(jìng)爭(zhēng)對(duì)手的絕對(duì)優(yōu)勢(shì),結(jié)合品牌理念深度挖掘項(xiàng)目?jī)?yōu)勢(shì)和產(chǎn)品價(jià)值,提升客戶品牌認(rèn)知、認(rèn)可度。
-
我們的客戶
帷拓科技?xì)v經(jīng)十年沉淀,與國(guó)內(nèi)外上千家客戶達(dá)成合作關(guān)系,其中穩(wěn)定合作的公司有:浙江華為、浙江移動(dòng)、浙江5G產(chǎn)業(yè)聯(lián)盟、浙江省社科院、綠城足球俱樂部、娃哈哈雙語學(xué)校、健康中國(guó)杭州峰會(huì)、科雷機(jī)電等,帷拓科技始終堅(jiān)持“帷有專業(yè),才能拓展無限”的服務(wù)理念,堅(jiān)持“認(rèn)真堅(jiān)持細(xì)節(jié)”的優(yōu)質(zhì)服務(wù)理念,不斷完善自身,成就企業(yè),最終實(shí)現(xiàn)共贏。
-
我們的業(yè)務(wù)
帷拓科技主營(yíng)業(yè)務(wù)范圍包含互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開發(fā)、小程序開發(fā)、商城網(wǎng)站建設(shè)、公眾號(hào)運(yùn)營(yíng)以及數(shù)字營(yíng)銷等,涵蓋了服務(wù)、房產(chǎn)、數(shù)碼、服裝、物流貿(mào)易等行業(yè),根據(jù)品牌現(xiàn)狀,為每個(gè)客戶量身定制項(xiàng)目整體服務(wù)方案,以敏銳的市場(chǎng)洞察力、創(chuàng)新的市場(chǎng)策劃能力,全面把握市場(chǎng)變化,為客戶實(shí)現(xiàn)從企業(yè)到消費(fèi)者的價(jià)值轉(zhuǎn)換。