Hoe prijzen kunnen verschillen (voor een website zoekfunctie)
De laatste weken waren we (Desk02 webdesign) koortsachtig op zoek naar een hosted zoekmachine-oplossing voor de website van een klant. Het was voor de klant cruciaal dat ook relevante PDF bestanden opgenomen werden in de website zoekresultaten. Ons CMS heeft wel een zoekfunctie maar dit gaat niet zover dat ook PDF-bestanden geïndexeerd worden.
Mijn eerste idee Google search, bleek niet geschikt omdat Google advertenties weergeeft in de zoekresultaten en een betaalde versie zonder de advertenties hebben ze niet (toch niet op kleine schaal).
Na wat zoeken had ik uiteindelijk een ander bedrijf gevonden die een dergelijke indexatie/zoek oplossing kon aanreiken maar bij het ontvangen van de offerte lag ik bijna van mijn stoel.
In de offerte die we ontvingen, werd voor de setup van de indexatie-dienst een bedrag gevraagd waar mijn ogen zwaar van open gingen … ± €10.000 en dan heb ik het nog niet over de jaarlijks weerkerende abonnementskosten van … ± €20.000! We hebben de offerte doorgespeeld naar de klant en die heeft er op zijn minst eens goed mee kunnen lachen.
Gelukkig was ik vroeger al eens een dienst tegengekomen die aan onze eisen voldeed maar met het verloop van tijd (enkele jaren) wist ik de naam niet meer. Na een lange tijd Googlen heb ik het bedrijf dan uiteindelijk toch teruggevonden (op pagina 16).
Het bedrijf in kwestie heet freefind en doet exact we zochten voor … $19/maand en geen setup-kosten.
Dat is dus $19/maand (geen setupkosten) tegenover ± €20.000/jaar (+ €10.000 setupkosten) voor dezelfde dienst.
Het grappige van de zaak was volgende quote op de website van freefind:
Both free (sponsored) accounts and subscriptions get the power of our search technology. Other search solutions have severely limited free versions and charge as much as $10,000 a year for some of these features.
Uiteraard zouden sommige features van de duurdere dienst ontbreken maar ik ben zeer duidelijk geweest in de offerte-aanvraag (zowel schriftelijk als telefonisch) en buiten het indexeren van heel de website (enkele honderden pagina’s) en enkele honderden PDF-bestanden heb ik geen features gevraagd.
Bij deze, als je ooit een betaalbare website zoekfunctie nodig hebt (die ook PDF-bestanden en dergelijke kan indexeren) … maar 1 adres en dat is freefind.com
Ps: Ik heb deze post onmiddellijk na mijn registratie bij freefind geschreven en ik ontvang net een (automatisch verstuurde) e-mail met de boodschap dat de volledige website én PDF bestanden reeds geïndexeerd zijn. Dat is dus maximum een half uurtje geleden! Freefind heeft er een serieuze fan bij.
May 12th, 2007 at 14:07
Zelf zou ik mnogosearch geïnstalleerd hebben. In combinatie met pdf2txt kan die perfect PDFs indexeren, uiteraard op voorwaarde dat die niet beveiligd/encrypted zijn, maar dat geldt voor elke oplossing.
May 12th, 2007 at 14:15
Luc: bedankt voor de tip. mnogosearch dient daarentegen geïnstalleerd te worden op de server en aangezien het om shared-hosting gaat is freefind in ons geval de beste oplossing.
May 13th, 2007 at 20:21
Lucene is geen out of the box oplossing, maar met een beetje werk krijg je daar wel heel goede resultaten mee, zowel Apache/java als een .net versie bestaan.
Umbraco heeft een Lucene search engine, indexeert websites, databases; en er bestaan genoeg oplossingen waarmee je Lucene PDf kan laten indexeren.
Als je Perl kunt draaien bestaat er Fluid dynamics search engine, PDF, Word, Excel, als er een driver voor bestaat dan krijg je het wel aan de praat, zowel Unix als Windows, manipuleren van de zoekresultaten, log van de keywords, voor 40$ per license is dat echt wel een goede oplossing.
http://www.xav.com/scripts/search/
May 13th, 2007 at 20:41
Drupal heeft ook een module dat toelaat om in PDF’s te zoeken.
May 16th, 2007 at 22:48
Bedankt voor alle tips. Handig om weten als ik in de toekomst nog met dergelijk ‘probleem’ geconfronteerd wordt.