Archyvas

2010.07 archyvas

Apie išaugusius duomenų kiekius paieškos sistemose

2010.07.13 Komentarų: 1

Šiandien perskaitęs Ričardo įrašą apie adresynus ir įrašų-sąrašų problemas, susimąsčiau apie tai, kokia neįsivaizduojama galybė informacijos yra sukaupta paieškos sistemose ir kaip greitai tie informacijos kiekiai auga. Ričardas savo įraše iškėlė klausimą dėl to, ar visas internete skelbiamas turinys yra kokybiškas. Tačiau mano nuomone, pagrindinis klausimas yra tas, ar verta paieškos sistemoms indeksuoti visą internete aptinkamą turinį ir kokia nauda iš suindeksuoto menkaverčio turinio informacijos ieškančiam vartotojui? Apie tai ir norėčiau daugiau pakalbėti.

Kai kas sako, kad interneto pradžia reikėtų laikyti Google sukūrimą 1998 metais. Tikriausiai tada niekas nė neįsivaizdavo, kad po daugiau nei 10 metų turėsime internete tiek nesuskaičiuojamo turinio. O pradžioje tais 1998 metais turinio buvo nei daug, nei mažai – 26 milijonai puslapių (žinoma, realiai jų buvo daugiau, bet būtent tiek buvo suindeksavusi Google). Per du metus, 2000 metais, suindeksuotų puslapių skaičius išaugo 40 kartų (pasiekė 1 milijardą). Po to įvyko lūžis ir duomenų kiekiai tiek išaugo, kad Google nusprendė nebeskaičiuoti, o šiuo metu net pati nežino, kiek suindeksuotų puslapių turi.

Kažkada Rokiškis rašė, kad Google tobulumas – neišpasakytas ir tai, kaip ši sistema sugeba atskirti kokybišką turinį nuo niekalo. Tai lyg ir patvirtina vienas iš Google inžinierių, paprastai paaiškinančių, kaip veikia ši paieškos sistema:

Tačiau vis dėlto man kyla dvejonių, ar tikrai Google (tiek ir kitos paieškos sistemos) sugeba informacijos ieškančiam vartotojui atrinkti būtent tai, ko jis tikisi surasti tame prie begalybės artėjančiame suindeksuotų puslapių lobyne. Atsimenu, dar pačioje Google susikūrimo pradžioje užtekdavo vos kelių minučių, o dažnai ir dar mažiau, kai įvedus į paieškos laukelį keletą žodžių galėdavai greitai tarp Google pateiktų rezultatų surasti tai, ko nori. Dabar gi viskas daug sudėtingiau. Rašydamas šį įrašą norėjau surasti diagramą, iliustruojančią išaugusį paieškos sistemose suindeksuotų puslapių skaičių. Einu į lietuviškąjį Google Vaizdai, suvedu frazę growth of indexed pages. Praleidžiu keletą minučių naršydamas po Google pateiktų rezultatų puslapius. Ne kažin ką randu. Keletą kartų tikslinu paieškos frazę. Growth of Google indexed pages (nieko, o pirmuose paieškos rezultatų puslapiuose daug nereikšmingų iliustracijų – vėliavos, kavos puodeliai, abstraktūs logotipai). Bandau to paties ieškoti nebe vaizduose – ir vėl gaunu arba nesusijusios informacijos, arba pasenusius duomenis. Praleidęs kokias 10 minučių paieškoms taip ir neradau ko norėjau.

Pavyzdys paprastas, bet tokių realybėje kiekvienas galime atrasti labai daug. Man atrodo, kad per pastarąjį dešimtmetį išaugus duomenų kiekiui paieškos sistemų algoritmai tiek neištobulėjo, kad sugebėtų apdoroti tokius kiekius sukauptos informacijos. Panašu, kad nei Google, nei kitai paieškos sistemai per gerą dešimtmetį nepavyko sukurti tobulo dirbtinio intelekto savo paieškos robotui (pvz., Googlebot). Tokį dirbtinio intelekto robotą, kuris galėtų suprasti, ko nori kiekvienas interneto vartotojas ir pateiktų rezultatus, pritaikytus būtent jam. Tokį robotą, kuris neitų indeksuodamas per praktiškai visas iš eilės internete aptinkamas nuorodas į puslapius, o atrinktų turinį.

Pavyzdžiui, galima pažiūrėti blogeriai.net srauto turinį. Absoliučią daugumą jo indeksuoja Google paieškos sistema. Tačiau ar tikrai absoliuti dauguma jo yra naudinga? Pavyzdžiui, vienas žmogus, nusipirkęs iPad’ą, parašo išsamią jo apžvalgą, o kitas tik įdeda video nuorodą. Abiejų straipsniai atsiranda informacijos apie iPad ieškančiojo paieškos rezultatuose. Tik kuris naudingesnis?

Kita vertus, kontekstinė reklama tarp paieškos rezultatų buvo ištobulinta gana neprastai. Ir kuo ilgiau žmogus ieškos reikiamos informacijos tarp paieškos rezultatų, tuo didesnė tikimybė, kad jis paspaus ant reklaminės nuorodos ir uždirbs pinigus paieškos sistemai. Kuo daugiau suindeksuotų puslapių turi paieškos sistema, tuo didesnė tikimybė, kad ji galės patenkinti didesnį ratą informacijos ieškančių žmonių? Tačiau kas užtikrins, kad mes rasime būtent tai, ko ieškome? Kas turi užtikrinti ieškomos informacijos kokybę: atsirinkti turi pats vartotojas ar tai turi padaryti paieškos sistema?..

[ad#468x60_GoogleAdsense]

Kategorijos: Technologijos Žymos:

Mini Zoo Klaipėdoje

2010.07.11 Komentarų: 0

Prieš kokį mėnesį lankėmės zoologijos sode-parke netoli Klaipėdos Mini Zoo. Kadangi gyvenu vėluodamas kokiu mėnesiu, tai nuotraukos tik šiandien.

Zoologijos sodas nėra labai didelis (tikriausiai negalima net lyginti su Kauno zoologijos sodu), bet pasivaikščioti po jį visai patiko. Gyvūnų netrūksta (žinoma, dramblių, žirafų, zebrų ar pandų nėra), o svarbiausia, kad kai kurie jų vaikšto laisvai. Todėl galima nueiti arti kupranugarių, danielių, asiliukų, lamų ar pelikanų, juos pamaitinti ar nusifotografuoti.

Žinoma, lankantis bet kuriame zoologijos sode už akių kliūva narvuose laikomi gyvūnai ir gerai matyti, kaip jie kankinasi tuose mažuose narvuose ar voljeruose. Kita vertus zoologijos sodai suteikia galimybę gyvai pamatyti gyvūnus, kuriuos tik esame matę nuotraukose.

Skaityti toliau

Vasara #1

2010.07.10 Komentarų: 1

Vasara jau įsibėgėjo, laukuose žmonės jau nupjovė žolę (baltuose ritiniuose esanti žolė jeigu neklystu vadinama silosu), pievose žolė išdegusi nuo saulės, savaitgalis vėl nusimato karštas… Kadangi susikaupė nemažai vasariškų kadrų, pats laikas jais dalintis su kitais.

Skaityti toliau

Kategorijos: Dienos akimirka Žymos: , ,

Panemunės dvarai ir miesteliai #5: Raudonės pilis

2010.07.08 Komentarų: 1

Raudonės pilis – kitas sustojimas keliaujant Panemune. Pilis stovi Raudonėje, netoli Nemuno. Šiek tiek paieškojęs informacijos internete, sužinojau, kad pilis gana sena – pastatyta XVI amžiuje, ne kartą rekonstruota, o savo galutinę išvaizdą įgavo po rekonstrukcijos XIX amžiuje. Šiuo metu joje veikia pagrindinė mokykla.

Bent jau man pilis pasirodė gana unikali – Lietuvoje panašios dar nesu matęs. Raudoni mūrai galbūt šiek tiek primena Trakų pilį, bet vis dėlto Raudonės pilies paskirtis buvo kitokia – kadaise tai buvo reprezentacinis pastatas, kuriame gyveno ne vienas didikas. Gražiausias man pasirodęs pilies akcentas – daugiau nei 30 metrų aukščio bokštas. Gaila, kad tik rašydamas šį įrašą sužinojau, jog už 1 litą į šį bokštą leidžia pakilti turistams ir pasižvalgyti po vietines apylinkes. Kaip atrodo vaizdas iš pilies bokšto, galima pažiūrėti miestai.net forume.

Raudonės pilis įsikūrusi dideliame parke. Prie pilies taip pat stovi vienas apleistas pastatas (nuotrauka žemiau). Kaip pavyko sužinoti, šis pastatas – tai kas liko iš buvusio malūno. Pažvelgus per šio pastato  sienų ir langų plyšius į vidų galima pamatyti kažką panašaus į girnas.

Keliaujantiems Panemune tikrai rekomenduoju aplankyti šia pilį. O čia keletas užfiksuotų Raudonės pilies ir parko nuotraukų:

Skaityti toliau

Kategorijos: Reportažas Žymos: , ,

Ilgasis savaitgalis baigėsi…

2010.07.07 Komentarų: 0

Nuvažiuota 1300 kilometrų. Kokius 3 kartus dėl į žmones panašių asilų, lenkančių 5+ mašinų koloną ir išvažiuojančių į priešingą eismo juostą, siekiant išvengti susidūrimo teko sukti į kelkraštį. Keletą dienų kaitinausi Lietuvos pajūryje. Išsimaudžiau lediniame Baltijos jūros vandenyje. Aplankyta nemažai dvarų. Grįžtant į Vilnių netoli Kryžkalnio patekau į liūtį ir kokius 20 km antra autostrados juosta su įjungtu avariniu signalu važiavau 50 km/h greičiu. Mėgstamiausia pasaulio futbolo čempionato komanda pateko į finalą… Ilgasis savaitgalis buvo geras. Daugiau ilgųjų savaitgalių!

Skaityti toliau

Kategorijos: Dienos akimirka, Skaitiniai Žymos: