|
graphiboc |
Posté le 17 Fév 2010 à 21:26 |
|
Messages : 262
|
Problème résolu avec QNetwork.
En fait Qhttp est totalement obsolète et renvoie donc une page 404 à chaque fois.
Et pour QNetwork, j'avais juste mal configuré le proxy.
Merci pour votre aide !
|
|
graphiboc |
Posté le 17 Fév 2010 à 18:39 |
|
Messages : 262
|
Je faisais ca sous DBP en appelant la dll urlmon.dll.
J'ai décidé de passer sous Qt qui m'offre plus de possibilités et de professionnalisme pour ce que je veux faire.
Seul probleme, la classe QHttp de Qt est obsolete et renvoi une erreur 404 pour toutes les pages alors qu'elles existent.
J'ai alors utilisé la classe QNetworkAccessManager mais cette fois-ci je n'ai même pas de réponse...
Mon but c'est de récupérer le code html d'une page, et le parcourir pour repérer toutes les images.
|
|
Mod |
Posté le 16 Fév 2010 à 22:54 |

Messages : 4954
|
Extension ou pas, tu as une réponse HTTP en te connectant à cette adresse là, ça reste donc téléchargeable. Il ne devrait pas y avoir le moindre soucis avec cela... Qu'utilises-tu pour télécharger les pages ?
|
|
jedd |
Posté le 16 Fév 2010 à 21:20 |

Messages : 24
|
Au risque de me répéter :
jedd a écrit :Comme ça se passe côté serveur, y'a pas grand chose à faire...
Maintenant il y a peut-être moyen de contourner le problème. A priori une telle URL ne t'empêche pas de télécharger la page (par exemple : quand tu l'ouvres avec un navigateur, celui-ci la télécharge et la place dans le cache). Donc, une fois que tu as la page, tu peux te servir du DOCTYPE de celle-ci pour analyser correctement son contenu.
>> http://fr.wikipedia.org/wiki/Document_Type_Definition (mes excuses, ce lien est de piètre qualité... fais donc une petit recherche Google)
PS : on veut bien t'aider à résoudre ton problème, mais il faudrait que tu nous en dise un peu plus sur la manière dont tu t'y prends pour télécharger les pages, ou de manière plus générale sur le but de ton projet.
|
|
graphiboc |
Posté le 16 Fév 2010 à 21:11 |
|
Messages : 262
|
Le premier lien est intéressant mais ne m'avance pas beaucoup : je fais comment du coup pour récupérer l'adresse initiale ?
Le second lien ne fonctionne sur aucune des adresses que je lui ai donné.
Merci en tout cas pour ton aide.
Quelqu'un a une autre idée ?
par exmeple comment fait le navigateur pour obtenir le code source lui ?
|
|
jedd |
Posté le 16 Fév 2010 à 20:18 |

Messages : 24
|
Salut,
Ton problème, on appelle ça une URL "user-friendly", traduire "compréhensible par le visiteur lambda". C'est un point important dans le domaine de l'accessibilité.
En général ces URL sont générées par un fichier HTACCESS, en utilisant l'URL Rewriting. Tu trouveras plus d'infos là-bas :
>> http://fr.wikipedia.org/wiki/.htaccess
Comme ça se passe côté serveur, y'a pas grand chose à faire...
Néanmoins, après une rapide recherche, je tombe sur ce site : http://realurl.org/index.php
Mais si on insère cet exemple : "http://www.presse-citron.net/mobile-world-congress-2010-casque-ecran-goldeneye-quand-motorola-se-prend-pour-q"
... ça ne fonctionne pas. 
Bref si c'est possible, tu trouveras ta solution du côté des .htaccess.
En espérant t'avoir aidé !
|
|
graphiboc |
Posté le 16 Fév 2010 à 19:48 |
|
Messages : 262
|
Salut à tous.
J'ai un problème : je souhaite récupérer le code source de certaines pages sur internet en les téléchargeant.
Je parle pas d'un téléchargement simple sous un navigateur, mais d'un téléchargement au sein même de mon programme puisque premièrement je dois télécharger les pages en masse, et deuxièmement, j'ai des traitements automatiques à appliquer au code source collecté.
Seul problème : pour des pages donc l'adresse se finit en .html et compagnie, pas de soucie puisque je télécharge directement un fichier html.
En revanche, j'ai quelques soucis avec les adresses sans extension, par exemple http://monsite.com/page1/01/. Cette adresse ne constitue pas un fichier téléchargeable, comment la remplacer par une adresse qui me donnerait directement un html ? (même si c'est du php qui le génère derrière).
Merci d'avance.
|