PhpDig.net

What is PhpDig?
PhpDig is a PHP MySQL based
Web Spider & Search Engine.
 


Download problems? Turn off any download manager/accelerator and then download.

Note that only PhpDig versions v.1.8.8 and v.1.8.9 RC1 are available for download.

Dernière version expérimental (Requirements)
2005-01-30 : Mise à jour mineure :
Multiple and multibyte support available (thanks to Mikolaj Jedrzejak for the ConvertCharset class).
Searching and highlighting content stored in a table works similar to the way it works for files.
The amount of content stored from each indexed page can be specified.
Indexing can be performed within entire subdirectory (thanks to td234).
The title displayed in search results can be limited to a certain length.
Renamed file and other miscellaneous edits/corrections.

zip file phpdig-1.8.8-rc1.zip 563.38 ko (direct link)
Dernière version stable (Requirements)
2005-01-16 : Mise à jour mineure :
Added ability to view previous search queries with links to search page.
Chunk encoding improvement in phpdigGetUrl function (thanks to attriel).
Improved indexing of links with special characters (thanks to zaartix).
Added ability to turn off click logging (thanks to vinyl-junkie).
Included some custom code to make own RSS and search templates.
Renamed some files and other miscellaneous edits/corrections.

zip file phpdig-1.8.7.zip 279.43 ko (direct link)
Licence
Ce programme est placé sous les termes de la licence GNU/GPL, ni plus, ni moins.
Voyez http://www.linux-france.org/article/these/gpl.html pour plus de détails sur la licence GPL.
Contenu de l'archive de la Dernière version stable
clickstats.php
custom_rss.php
custom_search.php
list.php
phpdig_logo_2.gif
phpdig_logo_2.png
phpdig_powered_2.gif
phpdig_powered_2.png
search.php

admin/cleanup_common.php
admin/cleanup_dashes.php
admin/cleanup_engine.php
admin/cleanup_keywords.php
admin/debug_functions.php
admin/deny.gif
admin/details.gif
admin/files.php
admin/fill.gif
admin/index.php
admin/install.php
admin/limit_update.php
admin/logout.php
admin/no.gif
admin/README.txt
admin/robot_functions.php
admin/spider.php
admin/statistics.php
admin/stop_spider.php
admin/update.php
admin/update_frame.php
admin/yes.gif

admin/temp/cronfile.txt
admin/temp/keepalive.txt

documentation/phpdig-api-en.html
documentation/phpdig-api-en.txt
documentation/phpdig-doc-en.html
documentation/phpdig-doc-en.txt
documentation/README.txt

includes/_connect.php
includes/common_words.txt
includes/config.php
includes/de_en_fr_common_words.txt
includes/it_common_words.txt
includes/README.txt
includes/style.css

information/CHANGELOG
information/COPYING
information/CREDITS
information/FILELIST
information/LICENSE
information/README

libs/auth.php
libs/authold.php
libs/function_phpdig_form.php
libs/htmlheader.php
libs/htmlmetas.php
libs/mysql_functions.php
libs/phpdig_functions.php
libs/search_function.php

locales/ca-language.php
locales/cs-language.php
locales/da-language.php
locales/de-language.php
locales/de-language-old.php
locales/en-language.php
locales/es-language.php
locales/fr-language.php
locales/gr-language.php
locales/it-language.php
locales/it-language-old.php
locales/nl-language.php
locales/no-language.php
locales/pt-language.php
locales/README.txt

rss/keepalive.txt

sql/init_db.sql
sql/update_db.sql
sql/update_db_to_1_4_4.sql
sql/update_db_to_1_4_5.sql
sql/update_db_to_1_6.sql
sql/update_db_to_1_6_1.sql
sql/update_db_to_1_8_1.sql
sql/update_db_to_1_8_2.sql
sql/update_db_to_1_8_4.sql
sql/update_db_to_1_8_5.sql
sql/update_db_to_1_8_6.sql

templates/black.html
templates/bluegrey.html
templates/corporate.html
templates/gaggle.html
templates/green.html
templates/grey.html
templates/lightgreen.html
templates/linear.html
templates/newspaper.html
templates/phpdig.html
templates/simple.html
templates/terminal.html
templates/yellow.html

text_content/keepalive.txt

tpl_img/aq_background.gif
tpl_img/bar_left.gif
tpl_img/bar_middle.gif
tpl_img/bar_right.gif
tpl_img/barre-verte.gif
tpl_img/barre-verte-bas.gif
tpl_img/barre-verte-bas-courte.gif
tpl_img/barre-verte-courte.gif
tpl_img/coininfd.gif
tpl_img/coininfg.gif
tpl_img/coinsupd.gif
tpl_img/coinsupg.gif
tpl_img/cprgo.gif
tpl_img/cprgradient.jpg
tpl_img/cprlogo.jpg
tpl_img/cprtitle.jpg
tpl_img/d.gif
tpl_img/fond.gif
tpl_img/g.gif
tpl_img/horzfeuil.gif
tpl_img/inf.gif
tpl_img/left.gif
tpl_img/orbar-center.gif
tpl_img/orbar-left.gif
tpl_img/orbar-right.gif
tpl_img/redbar_left.gif
tpl_img/redbar_middle.gif
tpl_img/redbar_right.gif
tpl_img/right.gif
tpl_img/space15_15.gif
tpl_img/sup.gif
tpl_img/vertfeuil.gif
tpl_img/weight.gif
Anciennes versions et changelog
2004-12-15 : Mise à jour mineure :
Added a constant based security check.
Conformed search output to standards (see http://www.php.net/manual/en/faq.html.php#faq.html.encoding).
Removed predefined server global from functions.
Fixed case in HTML entities (thanks to salzbermat).
Do not show "did you mean" if words not available.
Other miscellaneous edits/corrections.

zip file phpdig-1.8.6.zip 274.75 ko (direct link)

2004-12-12 : Mise à jour mineure :
Highlight fixed for databased content.
Major security fix (thanks to zaartix).
CHANGE YOUR PASSWORDS AND THEN UPGRADE REGARDLESS OF YOUR VERSION!

zip file phpdig-1.8.5.zip 269.50 ko (direct link)

2004-12-06 : Mise à jour mineure :
Ability to stop spider from browser added.
Search menu now supports search all option.
Can set different depths and links per site.
Text box available for multiple links via browser.
Explore path links with query string added (thanks to blueyed).
Return of update one page or directory (thanks to vinyl-junkie).
Fuzzy "did you mean" now by word not phrase (thanks to Rolandks).
Remove session variable fixed (thanks to Edomondo, indeh).
Relaxed cleaning regex in function (thanks to pavel).
Close connection added to requests (thanks to vital).
Limit to directory fixed for shell (thanks to indeh).
Remove duplicate log information (thanks to ChadK).
Encoding typo fix (thanks to kotaksurat99).

zip file phpdig-1.8.4.zip 268.50 ko (direct link)

2004-07-14 : Mise à jour mineure :
Fix chunk encoding transfer issue with GET requests (thanks to Nad).
Correct typo in defined variable (thanks to davenewt).
Improve limit to directory option so it is consistent across options.
Allow links per depth to be set on a site by site basis.
Various edits to files.

zip file phpdig-1.8.3.zip 248.16 ko (direct link)

2004-07-12 : Mise à jour mineure :
Magic quotes issue fixed when magic_quotes_runtime is on (thanks to majestique).
Authentication method based on cookies fixed (thanks to pki, RobM, manfred).
Variable edits for when register_globals is off (thanks to RobM).
Option to show hosts with dirs added to search menu.
Backwards order of search terms fixed.
Limit spider to specific directory.

zip file phpdig-1.8.2.zip 247.09 ko (direct link)

2004-07-06 : Mise à jour mineure :
Click tracking now available (thanks to alivin70 and JÿGius³).
Cron job text file management (thanks to alivin70 and JÿGius³).
Search has 'did you mean X instead' fuzzy (thanks to Rolandks).
GET request modification to pass cookies (thanks to fredh).
Reading of robots.txt file updated (thanks to Carl Mikkelsen).
PPT support using external binaries (thanks to Carl Mikkelsen).
Limit spider to max of Y number of links per depth per site.
Different authentication method based on cookies.
Multiple session IDs and var names removable.
Now reads base href tags for indexing.
Some extra characters allowed in URLs.
Plurality of some phrases updated.
RSS feeds by search available.
Search by site or directory.
Can remove '-' index pages.
Support for TIS-620 added.
Different keyword storage.
Various edits to files.
Some bug fixes.

zip file phpdig-1.8.1.zip 245.61 ko (direct link)

2004-01-19 : Mise à jour mineure :
The "and operator - exact phrase - or operator" replaces "words begin - exact words - any words part" options.
Security vulnerability in config.php file fixed (thanks to fraMe).
Support for iso-8859-7 and windows-1251 added (thanks to sv2bbi, others).
Characters '._~@#$:&%/;,=- now allowed in indexing and searches.
CSS modified in all templates and style.css file.
Various edits to several functions and/or files.
UPDATE TO VERSION 1.8.0 RECOMMENDED!

zip file phpdig-1.8.0.zip 219.79 ko (direct link)

2003-12-03 : Mise à jour mineure :
Escaping added to path and file if necessary (thanks to ullone).
Highlight fixed when keyword is followed by period (thanks to mark).
Regex relaxed to allow for more characters (thanks to RedThypon).
Max number of results per site changed to allow all results in limit to searches.
Search depth of level zero enabled for index.
Option to bypass renice command added.

zip file phpdig-1.6.5.zip patched* 217.30 ko (direct link)

*For all versions prior to 1.6.5 (and non-patched version 1.6.5) add this patch.

2003-11-17 : Mise à jour mineure :
Display fix in result message (thanks to 123av).
Regex applied to path and title (thanks to manfred).
Option to bypass is_executable added (thanks to manfred).
Option to specify temp filename length added (thanks to manfred).
Empty temp files no longer in temp directory (thanks to manfred).
Extension options and external binary process modified.
Option to set max number of results per site added.
Exact match word highlighting fixed again.

zip file phpdig-1.6.4.zip 208.08 ko (direct link)

2003-11-09 : Mise à jour mineure :
End of line marker fixed and added to config file (thanks to Rolandks).
Search box size and maxlength options added to config file (thanks to Rolandks).
Snippet display length option added to config file (thanks to plodz).
Missing l_time column added to logs table (thanks to Iltud, others).
The PHP strip_tags replaced with regular expression (thanks to Rolandks, manute).
The PHP mysql_create_db replaced with mysql_query (thanks to rayvd).
The PHPDIG_INCLUDE_COMMENT excluded from index (thanks to Iltud).
Extension options for external binaries added to config file.
Exact match word highlighting fixed.

zip file phpdig-1.6.3.zip 207.12 ko (direct link)

2003-04-06 : Mise à jour mineure :
Support pour les jeux de caractères autres que 8859-1, encodage 8859-2 ajouté (Jan Kincl).
PhpDig reconnaît les cookies meta http-equiv.
La fonction phpdigTestUrl a été corrigée.
Les classes Css pour le mode "classic" ont été corrigées.
Le bug sur les meta noindex et nofollow ont été corrigés (Michael Chapman).
Une documentation succinte de l'API (en anglais) a été ajoutée.
Les erreurs de création de la base de données survenant avec certaines versions de MySql ont été corrigées.
zip file phpdig-1.6.2.zip 202.54 ko (direct link)

2003-03-15 : Mise à jour mineure :
Support expérimental des cookies ajouté.
Retrait des SIDs des Urls possible.
Meilleure prise en compte des javascripts window.open.
Prise en compte des index par défaut en option.
Le caractère '+' est permis dans les Urls.
Ajout du temps moyen de recherche dans les logs.
Tous les paramètres de connexion MySql sont des constantes.
Bug dans l'installation "mise à jour" corrigé.
zip file phpdig-1.6.1.zip 179.48 ko

2003-03-09 : Mouvelle version :
PhpDig peut maintenant indexer les fichiers PDF, MS-Word et MS-Excel en utilisant des exécutables externes.
Mécanisme de verrouillage protégant un site des indexations concurrentes.
Tous les messages codés "en dur" sont maintenant localisés (Eric Chauvin).
Optimisation des requêtes de recherche et de l'analyse des templaes.
Conformité xhtml du template "PhpDig" et des interfaces d'administration ajoutée (Eric Chauvin).
L'interface web d'installation peut maintenant mettre à jour une base de données existante.
Certaines parties des documents HTML peuvent être exclues de l'indexation grâce à des commentaires dans le code.
Prise en charge des connexions MySql améliorée.
Des statistiques sur les recherches effectuées sont collectées afin d'améliorer le contenu du site en fonction de ce que cherchent les visiteurs.
Nouveau système de calcul de pertinence, minimisant le poids des pages contenant le même mot un grand nombre de fois.
Plus d'explications sur le fonctionnement de PhpDig ont été ajoutées dans la documentation.
zip file phpdig-1.6.zip 171.01 ko

2003-03-01 : Nouvelles fonctionnalités, corrections de bugs :
Les extraits textuels correspondent au mode de recherche (start/any/exact).
Meilleure configuration de affichage du texte dans les résultats.
Le robot peut lire un fichier contenant une liste de sites à indexer.
Plusieurs sites peuvent être indexés à la fois.
Nouveau design de l'interface d'administration.
Reprise et indexation forcées corrigées.
Analyse des templates corrigé.
Scripts de nettoyage de la base corrigés.
zip file phpdig-1.4.8.zip 137.84 ko

2003-02-26 : Nouvelles fonctionnalités :
Les tables peuvent être préfixées par une chaîne arbitraire.
L'indexation dans un domaine est désormais possible.
Meilleure implémentation des redirections.
Corrections de la documentation en anglais (John Zastrow).
Mise à jour des messages en allemand (Matthias Strohmaier).
Traduction des messages en Norvégien (Martin Kristiansen)
Traduction des messages en Tchèque (Dan Barta).
Les erreurs résiduelles E_ALL sont corrigées.
zip file phpdig_1_4_7.zip 130.03 ko

2003-02-22 : Nouvelles fonctionnalités :
PhpDig fonctionne désormais avec register_globals = off et/ou Error_reporting = E_ALL
Rétablissement du départ de la recherche à partir d'une autre URL que "/"
Les balises <?php ?> sont utilisées partout
Une option permet à la fonction de recherche de retourner un tableau
Toutes les fonctions ont été renommées et préfixées par "phpdig"
Utilisation de deux classes CSS pour le surlignage et les liens vers les pages trouvées
Quelques optimisations de code ont été effectuées
Si un message d'erreur survient pendant l'indexation, veuillez télécharger à nouveau l'archive. La première mise en ligne était corrompue (de 00:30:00 GMT à 11:30:00 GMT le 22/02)
zip file phpdig_1_4_6.zip 123.77 ko

2003-02-18 : Problème PHP :
Patch pour réparer la récupération de contenu suite à un bug PHP.
Consultez le Bug #22008 pour plus d'explications.
zip file phpdig_1_4_5c.zip 121.83 ko

2003-02-17 : Correction de bug :
L'indexation d'un hôte écoutant sur un autre port que 80 est rétablie.
zip file phpdig_1_4_5b.zip 121.82 ko

2003-02-16 : Améliorations, corrections de bugs :
L'archive du 16/02 comportait de mauvais fichiers. Ceci est corrigé
Note : Une mise à jour de la base de données est requise. Utilisez le fichier update_db_to_1_4_5.sql.
La recherche est maintenant une fonction, facilitant son intégration. (Les templates peuvent être qu'une partie de page.)
Surlignage corrigé.
Utilisation d'une CSS au lieu du fichier "style.php".
Les paramètres de configuration sont des constantes, sauf pour les tableaux.
Exclure un chemin de l'exploration est désormais possible.
zip file phpdig_1_4_5.zip 121.27 ko

2003-02-09 : Version corrigée :
PhpDig fonctionne avec PHP 4.3.0 (mais toujours avec register_globals=on).
Correction de l'indexation en ligne de commande (php-cli).
Correction des Templates.
zip file phpdig_1_4_4c.zip 117.98 ko

2001-12-03 : Version corrigée :
Doublons insérés dans la table "site" corrigé.
zip file phpdig_1_4_4b.zip 116.34 ko

2001-12-02 : Nouvelles fonctions, corrections de bugs :
PhpDig peut explorer un site en écoute sur un port autre que le port 80.
PhpDig peut également indexer un site protégé par mot de passe (Il est recommandé de lire la mise en garde à ce sujet dans la documentation).
Vue améliorée des répertoires dans l'interface d'administration.
Les caractères spéciaux islandais (!) sont supportés.
Phpdig fonctionne désormais sur un serveur configuré en error_reporting = E_ALL.
Mauvaise analyse du header HTTP Last-Modified corrigée.
zip file phpdig_1_4_4.zip 112.25 ko

2001-11-27 : Mise à jour et correction de bugs mineurs :
Système de modèles amélioré
Un champ a été ajouté dans la table keywords, pour améliorer les temps de réponse
Les requêtes qui causaient parfois des erreurs ont été corrigées
La portion de code causant parfois des core dumps a été corrigée
L'absence de mise à jour des contenus textuels a été corrigée
La mise à jour d'une branche/d'un fichier a été corrigée
zip file phpdig_1_4_3.zip 109.45 ko

2001-11-24 : Mise à jour mineure :
Documentation complète en anglais ajoutée.
Amélioration de l'analyse des fichiers robots.txt : Le caractère * est supporté ainsi que les fichiers (avec chemin complet).
Le caractère spécial "ß" est inclus dans l'indexation, certains mots en allemand n'étant pas reconnus. Merci à Christof Fritz pour la remontée de bug.
zip file phpdig_1_4_2.zip 107.42 ko

2001-11-18 : Mise à jour de la documentation :
Version complète en anglais ajoutée.
zip file docs_2001-11-18.zip 34780 octets

2001-11-11 : Correction mineures de bugs :
Les deux précédents patches sont inclus
La documentation complète en français est include (J'ai besoin d'aide pour une traduction correcte en anglais)
Authentification HTTP Simple ajoutée
zip file phpdig_1_4_1.zip 89741 octets

2001-11-11 : Nouveau patch pour la version 1.4 :
Bug corrigé dans l'anayse des liens relatifs.
Bug corrigé dans la fonction test_url().
Remerciements à Florian Perrichot pour la remontée de bug
zip file patch_1_4-2.zip 12440 octets

2001-11-07 : Patch de dernière minute pour la version 1.4 :
Correction des derniers bugs : remplacez les fichiers index.php à la racine, spider.php dans admin/, config.php dans includes/ et black.htm dans templates/. weight.gif est un nouveau fichier(racine).
zip file patch_1_4.zip 10246 octets

2001-11-06 : Nouvelle version :
L'indexation et l'exploration de liens sont menés désormais de concert.
Charge réduite pour les serveurs indexés grâce à un système de cache.
La page de résultat inclut un extrait du document qui contient les occurences des mots recherchés.
Les scripts d'administration et de configuration, ainsi que les librairies sont dans des répertoires séparés, que l'on peut protéger à l'aide de fichiers .htaccess.
La page de résultats est facilement customisable par un système de modèles (exemples fournis).
Mode CGI amélioré permettant une mise à jour totalement automatique par une tâche cron.
Un grand Merci à Florian Perrichot pour le système de cache et les templates.
Fichier de traduction portugaise fourni par Carlos Serrão.
zip file phpdig_1_4.zip 67716 octets

2001-06-04 : Correction de bug :
Un bug qui conduisait PhpDig à envoyer une requête http sur chaque nouveau lien trouvé même si il avait déjà testé ce lien a été corrigé.
zip file phpdig_1_0_4.zip 62656 octets

2001-05-28 : Mise à jour mineure :
Fichier de traduction en italien fourni par Mirko Maischberger.
zip file phpdig_1_0_3.zip 62575 octets

2001-05-27 : Mise à jour mineure :
Les versions cgi et http de l'indexation sont désormais dans le même script.
Le code est beaucoup plus commenté pour les développeurs.
zip file phpdig_1_0_2.zip 58551 octets

2001-05-22 : Corrections de bugs :
Champ manquant dans le script init_db.sql corrigé.
L'exclusion de termes dans la recherche est corrigé.
Les apostrophes et guillemets dans le formulaire s'affichent correctement.
zip file phpdig_1_0_1.zip 60737 octets

2001-05-19 : Version stable :
Fichier de messages espagnols fourni par Geffrey Velásquez.
Un bug sur le traitement des attributs "alt" dans les balises img a été résolu.
Le metatag "description" est inclu dans l'affichage des résultats de recherche.
zip file phpdig_1_0.zip 60691 octets

2001-05-14 : Corrections et Mise à Jour :
Un bug qui causait l'insertion de doublons dans la base de données a été corrigé.
Un bug dans le script update_cgi a été corrigé.
Un bug qui empêchait PhpDig de détecter correctement les metatags Description et Keywords a été corrigé.
Un bug dans l'analyse des html entities a été corrigé.
Un bug dans la fonction html_to_plain_text() qui causait une mauvaise reconnaissance de mots distincts a été corrigé.
Le Header Http 'Last-modified' est maintenant pris en compte. n'oubliez pas de mettre à jour votre base de données à l'aide du script update_db_0_99.sql !
Le Metatag 'Revisit after' est reconnu.
Les sous-répertoires dans le fichier robots.txt sont pris en compte.
On peut maintenant supprimer un site entier de la base.
Correction de dernière minute : Dans les scripts d'indexation, commenter la ligne de debug $upddate = 0; (ligne 78, et 102 dans le script cgi)
zip file phpdig_0_99.zip 60214 octets

2001-05-10 : Mise à jour :
Fichier de traduction en allemand fourni par Gregor Mucha.
Liste de mots communs en allemand fournis par la même personne.
Les noms de domaines externes sont indexés (i.e. www.gnu.org) et peuvent être retrouvés par la recherche.
Les fichiers COPYING, README et LICENSE ont été ajoutés dans l'archive.
zip file phpdig_0_98b.zip 58187 octets

2001-05-08 : Mise à jour :
Le fichier robots.txt est pris en compte, ainsi que les balises META ROBOTS, selon le standard décrit dans The Web Robots Page.
L'indexation des fichiers texte est accélérée.
Les fichiers sans extension sont maintenant indexés.
Les index et clef primaires de la base sont légèrement modifiés. (PhpMyAdmin permet de les modifier à la volée, vérifiez le fichier init_db.sql.
zip file phpdig_0_97b.zip 48729 octets

2001-05-06 : Mise à jour :
Quelques fichiers ont été corrigés par Brien Louque : documentation_en.html, search.php, en-language.php
Traduction grecque fournie par Sofoklis Magoulas.
Un script de mise à jour automatique a été ajouté, il se lance par la crontab avec une instance cgi de php.
Le délai d'expiration des pages est pris en compte par les scripts d'indexation.
zip file phpdig_0_96b.zip 43779 octets

2001-05-05 : Mise à jour :
PhpDig est maintenant disponible à la fois en Français et en Anglais.
Des formulaires localisés sont fournis dans l'archive.
zip file phpdig_0_95b.zip 38275 octets

2001-05-03 : Mise à jour :
English doc was added to the archive.
L'algorithme de recherche a été refondu. Moins de SQL, plus de php.
La localisation dans différentes langues est en cours.
On peut désormais exclure des termes de la recherche.
Le calcul de pertinence est un produit et non plus une somme.
Le formulaire de recherche et la page de résultat sont fournis en version anglaise temporairement sous forme de deux fichiers séparés.
zip file phpdig_0_93b.zip 39285 octets

2001-05-02 Corrections mineures :
Le problème de la page de résultats qui ne gardait pas les filtres lors de la navigation entre pages a été résolu.
Les liens news: ne sont plus suivis.
Quelques requêtes SQL ont été optimisées.
Pour la recherche, SQL_BIG_SELECT est positionné à 1.
PhpDig ne se fait plus passer pour IE lors des tests d'urls ;-).
zip file phpdig_0_92b.zip 34203 octets

2001-05-02 Bug Fix pour la version 0.91b
Le script search.php ne passait pas tous les paramètres dans la navigation parmi les résultats
zip file search.zip 2601 octets

2001-05-01 Correction mineure :
Le problème de l'indexation des textes trops longs qui bloquaient le moteur a été corrigé.
zip file phpdig_0_91b.zip 31436 octets

2001-04-30 Première release de PhpDig :
zip file phpdig_0_9b.zip 31180 octets


Powered by: vBulletin Version 3.0.7
Copyright ©2000 - 2005, Jelsoft Enterprises Ltd.
Copyright © 2001 - 2005, ThinkDing LLC. All Rights Reserved.