杭州網(wǎng)站設(shè)計:搜狗搜索事業(yè)部總經(jīng)理:從識圖搜索談未來大勢
分享 2011.08.30 瀏覽次數(shù):7065次
搜狗搜索事業(yè)部總經(jīng)理:從識圖搜索談未來大勢
經(jīng)過近半年的獨立研發(fā),搜狗搜索推出了識圖搜索功能,即可通過上傳圖片等方式搜索找到相似群組圖片和資料。日前,就這一新功能以及搜索領(lǐng)域熱點話題,CSDN記者專訪了搜狗公司搜索事業(yè)部總經(jīng)理茹立云。
搜狗公司搜索事業(yè)部總經(jīng)理茹立云
關(guān)鍵詞:杭州網(wǎng)站建設(shè)
深度調(diào)研和數(shù)據(jù)挖掘用戶需求
CSDN記者:請談?wù)勊压纷鲎R圖搜索功能的初衷是什么?
搜狗公司搜索事業(yè)部總經(jīng)理茹立云:主要基于用戶需求的轉(zhuǎn)變,包括兩個層面。第一個層面是整個互聯(lián)網(wǎng)技術(shù)都在提升,用戶背后的需求一直得不到滿足,以前大家搜索主要靠文字,隨著時代的進步,媒介使用設(shè)備的更新,用戶對基于圖片、音頻、視頻等跨媒體搜索需求越來越大。比如說,在搜狗的搜索引擎里面,過去搜一張圖片是誰,會有1000萬以上的結(jié)果。到現(xiàn)在,更多用戶不再滿足于僅僅看到圖片,而想了解圖片背后的故事是什么。第二,隨著新興媒體的誕生,像微博,對識圖搜索的需求越來越大,用戶想知道要加的這個人是不是真實的那個人,包括北京下暴雨網(wǎng)上出現(xiàn)了大量通過PS出來的虛假圖片,還有動車事故也有很多虛假的圖片,廣大網(wǎng)友難辨真?zhèn)危砸黾颖鎰e能力,識圖技術(shù)就可以辨別事情的真?zhèn)?。此外,我們也考慮到了搜狗的優(yōu)勢,識圖能夠更加便捷,搜狗通過跟瀏覽器結(jié)合,用戶使用識圖越來越方便。
記者:當時開發(fā)識圖搜索功能的時候搜狗團隊內(nèi)部有沒有一些分歧?
茹立云:初期做了比較多的調(diào)研,最主要的調(diào)研包括三個方面:1.首先是用戶的潛在需求到底會有多大,這個我們對相關(guān)數(shù)據(jù)做了挖掘和分析;2.另外就是調(diào)研了識圖或者圖片相關(guān)技術(shù),要支撐這么一個識圖的產(chǎn)品在技術(shù)層面是不是成熟;3.同時現(xiàn)在用戶使用的話是不是便捷,如何能夠給用戶提供更好的體驗。通過調(diào)研,搜狗發(fā)現(xiàn),一旦發(fā)現(xiàn)用戶背后的需求非常巨大,做這么一個產(chǎn)品自然而然成為大家的共識。一開始討論比較多的是用什么樣的技術(shù)方案研發(fā)出來,并且能夠很好的做好。但是對于這個功能,我們內(nèi)部是一直看好的。
記者:與Google推出的識圖搜索功能相比如何?
茹立云:搜狗的識圖搜索跟Google比較有幾個比較重大的創(chuàng)新,我們發(fā)現(xiàn)用戶在之前的識圖需求里面,除了想找到跟這張圖片及文化一樣的圖片之外,很多同組的圖片可能也是他感興趣的,比如說搜一張搞笑的圖片,能不能把其他的搞笑的圖片搜在一起。搜狗已經(jīng)不僅僅是基于圖像的內(nèi)容,同時把它文字上的含義,或者說它的語意結(jié)合在一起,找到同組合的圖片,這是一個創(chuàng)新。第二塊兒就是發(fā)現(xiàn)用戶在使用識圖的時候,如果單純用一種網(wǎng)絡(luò)服務(wù)的形式的話,使用環(huán)節(jié)會非常不便利,但是如果把它和瀏覽器很好的緊密結(jié)合在一起,使用識圖的過程就變得特別簡單了,隨時隨地都可以識圖,不用像之前要記住這個網(wǎng)址,拷下來輸進去。
關(guān)鍵詞:杭州網(wǎng)站制作
技術(shù)門檻較高 在微博領(lǐng)域可發(fā)揮大作用
記者:采訪之前,我也找業(yè)界的人咨詢了識圖搜索技術(shù),據(jù)說難度非常大。能否用通俗的語言解釋一下技術(shù)上的實現(xiàn)方式?
茹立云:搜狗識圖主要包括以下幾個技術(shù):
首先,圖像有效特征的抽取。有一句話叫做“一圖勝千言”,圖片包含了大量的語意,是用各種各樣的顏色、紋理特征表現(xiàn),怎樣能夠找到一種有效地特征來描述,對圖像壓縮、變形、光照的變化都不會受它的影響,這些特征不是搜狗定的,這是里面比較困難的點,就是圖像有效特征的抽取。
其次,要抽取這個特征的話怎么把它理想化,一旦理想化之后才可能成為一種索引,否則就沒有辦法進行索引,后續(xù)的效力就沒有辦法得到保證。搜狗對識圖效果的要求非常高,一張圖在匹配這塊兒要求在10秒以內(nèi)把結(jié)果反饋回來,有效特征的表示是其中一大難點,以及怎么樣建立一個索引。
第三,去偽存真。有了大量跟當前圖片類似的圖片,怎么樣從里面能夠提取出表示這個圖片含義的語意,現(xiàn)在中文互聯(lián)網(wǎng)的情況比外文互聯(lián)網(wǎng)的情況復(fù)雜很多,比如說很多明星的照片,比如說減肥,都會被網(wǎng)上盜用,怎么能夠去偽存真,真正找到這張圖對應(yīng)的是誰。
第四,搜狗做了同主題圖片的識別。有別于之前一般的做法,僅僅根據(jù)圖片的特征和語意,搜狗技術(shù)還用到了圖片之間的鏈接關(guān)系,怎么樣能夠把這種鏈接的關(guān)系應(yīng)用起來,同時提高識圖的精度。
記者:我們在圖片上可能會存在一些關(guān)鍵字或敏感詞,能否對這些關(guān)鍵詞進行識別?
茹立云:從技術(shù)上來講,如果不是手寫的話,印刷體內(nèi)容的識別技術(shù)是非常成熟的,在90年代末的時候,OCR(Optical Character Recognition光學(xué)字符識別)的技術(shù)已經(jīng)非常成熟,里面唯一有困難的是怎么樣對圖片進行切割。所以O(shè)CR的技術(shù)本身是非常成熟的,另外搜狗目前還沒有應(yīng)用,但是搜狗這塊兒技術(shù)有儲備,我們跟清華有聯(lián)合實驗室,在90年代末的時候基本上已經(jīng)可以做到極致了。之前的四庫全書的數(shù)字化已經(jīng)做到了這個工作,現(xiàn)在我們會看到微博上有印刷體的圖,印刷體的識別現(xiàn)在是非常成熟的技術(shù)。
記者:現(xiàn)在微博上需要進行關(guān)鍵字審核,很多人可以先發(fā)內(nèi)容,然后再截一張圖下來。這樣基于圖的內(nèi)容審核會比較麻煩。
茹立云: 對。這個不在于識圖,在監(jiān)控里面如果有這種需求,已經(jīng)有非常成熟的技術(shù),基本上國內(nèi)的高校都有這樣的技術(shù)。
記者:搜狗的識圖搜索技術(shù)在業(yè)內(nèi)是什么樣的水平?
茹立云:之前我們也做過精度測試,都不遜于當前任何主流的識圖產(chǎn)品,另外在信息的及時度上,當天出現(xiàn)的熱點,當天能否搜索出來,搜狗可以當天搜索出來,但是我們看到其他的同類產(chǎn)品還不支持(到這個及時度)。圖像這塊兒搜狗在搜索引擎領(lǐng)域有7年的積累,在圖像技術(shù)上不能說比別人一定強,但是不會比其他家落后,現(xiàn)在大概是這個情況。整個研發(fā)到最后推出與創(chuàng)新點結(jié)合在一起,速度非常迅速。
任何有道德的公司都不會去觸犯保護用戶隱私的底線
記者:網(wǎng)上有些圖片是有所有權(quán),搜狗識圖是怎么處理的?
茹立云:現(xiàn)在對于互聯(lián)網(wǎng)來講,圖片搜索還沒法辨別它是不是有所有權(quán),什么人擁有這個所有權(quán),要通過投訴的渠道。另外,會做一些比較敏感的圖片的過濾。
記者:如何看待識圖搜索可能會涉及用戶個人隱私的問題?
茹立云:據(jù)現(xiàn)在的了解,之前也跟國內(nèi)的圖像權(quán)威人士做了比較多的交流,基于頭像識別的技術(shù),或者人臉識別的技術(shù)在開放性方面是不完備的,效果有待于進一步提升。首先在技術(shù)上這個門檻還沒有跨越;其次就是保護層面,由于技術(shù)的不成熟,用人臉識別這種方式的話,本身這種擔心是有必要的,但是也并不是非常有必要的事情。作為任何一家有社會責任的公司,推出任何可能涉及隱私產(chǎn)品的時候,一方面要多聽一聽公眾的意見,都不會去侵犯這個底線,隱私是需要保護的。另外一方面需要通過一些技術(shù)手段或者其他一些手段能夠保護用戶的隱私。
記者:但是普通的用戶并不是很了解,他們就覺得隱私被侵犯了。
茹立云:現(xiàn)在搜狗的識圖搜索技術(shù)還不會用人臉識別的技術(shù)在里面。
記者:您對目前搜索市場怎么看?尤其是國內(nèi),百度基本處于壟斷地位,你對搜狗的未來是如何規(guī)劃的?
推薦和整合功能是關(guān)鍵
茹立云:對搜索引擎市場來講,其實現(xiàn)在還是處于蓬勃發(fā)展的階段,無論是全球范圍內(nèi)還是中國范圍內(nèi),市場的潛力還是非常巨大的,尤其是國內(nèi)市場潛力更加巨大,主要是幾方面。
第一,國內(nèi)的網(wǎng)民還在繼續(xù)增長,不只在說PC端,無線端也在高速成長。
第二,中國有2000萬家中小企業(yè),現(xiàn)在進行互聯(lián)網(wǎng)營銷的有20幾萬家,規(guī)模跟國際上比起來還小很多,整個中國的經(jīng)濟處于高速的發(fā)展中,互聯(lián)網(wǎng)以及電子商務(wù)在不斷地普及,從企業(yè)需要營銷的方面來講未來也會有很大的增長。整個行業(yè)處于比較好的發(fā)展時期,當然現(xiàn)在也面臨一些問題,比如說搜索引擎在互聯(lián)網(wǎng)上營銷的控制可能是其中的一個問題,不能讓一些虛假的廣告?zhèn)Φ接脩?,所以這也是大家盡力去解決的事情。
具體到搜狗來說,里面的機會在于:
第一,我們有跟客戶端,瀏覽器有協(xié)同作戰(zhàn)的做法,在用戶入口方面有優(yōu)勢。
第二,搜狗搜索有比較多的技術(shù)創(chuàng)新,像剛才提到的識圖搜索,以及前期提到的全搜索技術(shù)。用戶在使用搜索的時候更加便捷、全面、及時。通過入口的把握以及對產(chǎn)品的創(chuàng)新使得用戶越來越多的用搜狗并且喜歡搜狗,這也是過去的一年我們?yōu)槭裁磿@么快速成長的原因之一。
另外,未來搜狗會更多的探索瀏覽器跟搜索結(jié)合的搜索模式,現(xiàn)在的搜索還是稱作為第二代搜索,那么第三代搜索需要轉(zhuǎn)變一種形式,不再像現(xiàn)在這樣簡單的關(guān)健詞搜索,是一種無處不在的搜索,用戶要看到一篇新聞的時候,搜索引擎可以告訴你背后是什么,給你推薦相關(guān)的內(nèi)容,從整個互聯(lián)網(wǎng)發(fā)展來講,第一代是瀏覽器,第二代是搜索,第三代我們把它稱為總推薦,其實是搜索的延伸。搜狗未來希望在這個領(lǐng)域做出比較大的創(chuàng)新性的產(chǎn)品出來,搜索不再像現(xiàn)在靠關(guān)健詞做的搜索,可以把它稱為探索式的搜索,用戶看這篇文章背后的需求是什么,我可以告訴你進一步你想做的一些什么事情。
記者:搜狗搜索跟瀏覽器整合,目前大概的進展是什么樣的?
茹立云:目前我們已經(jīng)在做這個層面的整合,像識圖功能通過跟瀏覽器結(jié)合,使得用戶使用的便捷和體驗有非常好的提升。另外,之前的消息盒子會做視頻的推薦,比如說用戶看過某一個連續(xù)劇,這是一個更新的連續(xù)劇,如果有新的出現(xiàn)的話,將第一時間推薦給你,不需要用戶自己不停的搜索看看有沒有新的,是這種推薦的概念。像音樂搜索,也會搜索頁面上是不是存在一些應(yīng)用,如果你感興趣的直接就可以在頁面上應(yīng)用,會非常的便捷。未來像電子商務(wù)、軟件、旅游酒店這塊兒都會跟推薦引擎結(jié)合在一起。
標簽:杭州精品網(wǎng)站設(shè)計
興趣為先 扎實基本功最重要
記者:對于一些想進入搜索領(lǐng)域的學(xué)生或技術(shù)人士,您有什么建議?
茹立云:想跨入搜索領(lǐng)域有很多種方式,本身跟搜索相關(guān)的領(lǐng)域要有特別全面的人才,比如說是一個技術(shù)人員的話,基本功一定要扎實,比如說編程基本功打好了,才能夠做很多比較高深尖的技術(shù)。此外,還要選好入門搜索引擎領(lǐng)域的方向,如果本身對互聯(lián)網(wǎng)的產(chǎn)品非常喜歡,就可以做跟產(chǎn)品相關(guān)的工作。如果對網(wǎng)民這塊兒有感覺,跟他們聯(lián)絡(luò)有感覺,你就可以做產(chǎn)品應(yīng)用的工作,搜索引擎這個行業(yè)出來的人才是多種多樣的,關(guān)鍵是你是不是對這個感興趣,只要感興趣并且有基礎(chǔ),又為之去努力,做這個行業(yè)并不是太難的事情。
記者:技術(shù)人員的基本功具體包括哪些部分?
茹立云:這跟計算機科學(xué)的基礎(chǔ)技術(shù)比較相關(guān),比如說像操作系統(tǒng)、編程基礎(chǔ)課程等等。你想在里面有更進一步的發(fā)展,最好還要會編程語言處理、自然語言處理、技術(shù)學(xué)識這些計算機領(lǐng)域的專長。
備注:
關(guān)于搜狗識圖搜索:能實現(xiàn)以圖搜圖,即通過上傳圖片、鼠標拖拽、鼠標選圖、輸入圖片URL地址等多種方式搜索,找到互聯(lián)網(wǎng)上與這張圖片相似的其他圖片,并且利用圖片識別技術(shù),進一步分析圖片內(nèi)容的主題,找到與這張圖片同主題的其他圖片。
關(guān)鍵詞:杭州精典網(wǎng)站制作
-
杭州網(wǎng)站設(shè)計公司:品牌網(wǎng)站開發(fā)助力企業(yè)成長
日期:2024-12-20瀏覽次數(shù):593次
-
杭州網(wǎng)站建設(shè)公司:商城網(wǎng)站建設(shè)的六大關(guān)鍵步驟
日期:2024-12-18瀏覽次數(shù):627次
-
杭州網(wǎng)站制作:醫(yī)院網(wǎng)站設(shè)計與域名備案的復(fù)雜性探討
日期:2024-12-18瀏覽次數(shù):621次
-
杭州網(wǎng)站制作公司:打造安全可靠的醫(yī)院網(wǎng)站
日期:2024-12-11瀏覽次數(shù):813次
-
杭州網(wǎng)站設(shè)計公司:數(shù)據(jù)庫在高端網(wǎng)站制作中的關(guān)鍵作用
日期:2024-12-11瀏覽次數(shù):776次
相關(guān)新聞
整合同類新聞,相關(guān)新聞一手掌握
-
亳州開發(fā)哪家公司好
日期:2023-02-08瀏覽次數(shù):1798次
-
亳州app開發(fā)后還要做哪幾步?
日期:2021-02-02瀏覽次數(shù):2425次
-
帶你了解封裝類亳州app開發(fā)
日期:2021-02-02瀏覽次數(shù):2073次
-
優(yōu)秀的亳州網(wǎng)站制作,應(yīng)該具備哪些能力?
日期:2020-10-21瀏覽次數(shù):2163次
-
優(yōu)秀的亳州網(wǎng)站建設(shè)五大要素
日期:2020-10-21瀏覽次數(shù):2074次
最新新聞
與互聯(lián)網(wǎng)同行,實時掌握網(wǎng)建行業(yè)最新動態(tài)
-
手機網(wǎng)站與微網(wǎng)站的的區(qū)別
日期:2016-08-01瀏覽次數(shù):4716次
-
2016手機市場從線上走到線下 推廣費用需要多少
日期:2016-11-24瀏覽次數(shù):4700次
-
杭州小程序開發(fā),“報備審核”開發(fā)者須知
日期:2020-04-17瀏覽次數(shù):5709次
-
杭州開發(fā)微信小程序如何接入微信支付?
日期:2020-05-07瀏覽次數(shù):4741次
-
為什么要進行杭州網(wǎng)站優(yōu)化呢?
日期:2021-05-08瀏覽次數(shù):4261次
隨機新聞
新聞新動態(tài),您需要的新聞管家
洞悉市場趨勢演變讓傳播回歸社會
免費獲取網(wǎng)站建設(shè)與網(wǎng)絡(luò)推廣方案報價
-
關(guān)于我們
杭州帷拓科技有限公司,是一家新型的全案網(wǎng)絡(luò)開發(fā)公司,作為以互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開發(fā)、小程序開發(fā)為核心的專業(yè)網(wǎng)絡(luò)技術(shù)服務(wù)供應(yīng)商,帷拓科技致力于全面分析市場環(huán)境、衡量與預(yù)測市場需求、整合區(qū)別于行業(yè)競爭對手的絕對優(yōu)勢,結(jié)合品牌理念深度挖掘項目優(yōu)勢和產(chǎn)品價值,提升客戶品牌認知、認可度。
-
我們的客戶
帷拓科技歷經(jīng)十年沉淀,與國內(nèi)外上千家客戶達成合作關(guān)系,其中穩(wěn)定合作的公司有:浙江華為、浙江移動、浙江5G產(chǎn)業(yè)聯(lián)盟、浙江省社科院、綠城足球俱樂部、娃哈哈雙語學(xué)校、健康中國杭州峰會、科雷機電等,帷拓科技始終堅持“帷有專業(yè),才能拓展無限”的服務(wù)理念,堅持“認真堅持細節(jié)”的優(yōu)質(zhì)服務(wù)理念,不斷完善自身,成就企業(yè),最終實現(xiàn)共贏。
-
我們的業(yè)務(wù)
帷拓科技主營業(yè)務(wù)范圍包含互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開發(fā)、小程序開發(fā)、商城網(wǎng)站建設(shè)、公眾號運營以及數(shù)字營銷等,涵蓋了服務(wù)、房產(chǎn)、數(shù)碼、服裝、物流貿(mào)易等行業(yè),根據(jù)品牌現(xiàn)狀,為每個客戶量身定制項目整體服務(wù)方案,以敏銳的市場洞察力、創(chuàng)新的市場策劃能力,全面把握市場變化,為客戶實現(xiàn)從企業(yè)到消費者的價值轉(zhuǎn)換。