Abonnement à ma liste de contacts

Etoiles inactivesEtoiles inactivesEtoiles inactivesEtoiles inactivesEtoiles inactives
 

Une fois n'est pas coutume, je ne vais pas vous présenter dans cet article de code à proprement parler, mais nous allons vous interdit sur un ensemble d'expressions rationnelles, de nous appelons dans notre jargon d'informaticien des regex ou expressions régulières qui vont nous permettre de pouvoir extraire, à partir d'une page d'un compte Instagram, un ensemble d'informations fort intéressantes, susceptibles d'être réutilisées, par exemple, pour afficher sur un site internet tiers des informations à jour d'un compte Instagram donné.

Je ne m'attarderai pas trop sur la manière de faire pour récupérer le code source de la page, ceci est possible grâce à la fonction file_get_content de PHP. 
Une fois ce contenu récupéré dans une variable par exemple, il va nous suffire d'appliquer l'une des expressions rationnelles que je vais vous présenter ci-dessous, pour récupérer le contenu souhaité.

  • Type du profil instagram : <meta property="og:type".*content="(.*)"
  • URL de l'image du compte : <meta property="og:image".*content="(.*)"
  • Titre de la page : <meta property="og:title".*content="(.*)"
  • URL de la page Instagram : <meta property="og:url".*content="(.*)"
  • Description de la page Instagram : <meta property="og:description".*content="(.*)"
  • Meta contenu: <meta content="(.*)".*name="description"
  • Autorisation de bots de crawl (la page autorise t elle les bots à grabber la page) : \["InstagramSEOCrawlBot".*{.*is_allowlisted_crawl_bot":(.*),?"
  • Autorisation du bot de google crawl (Autorisation des bot SSL) : "is_crawler_with_ssr".*:(.*),?"
  • Autorisation bot derriere un proxy : "is_crawler_with_relay".*:(.*),?"
  • Biographie de l'auteur du compte (mais necessite un "nettoyage" de la chaine rtournée en JSON et un décodage uuencode) : {"data":{"biography":"(.*)"
  • Catégorie/type du compte : "category_name":"(.*)"
  • Nom complet du compte : "full_name":"(.*)"
  • Le compte possède-t-il un numéro de téléphone, et si oui, lequel : "has_phone_number":(.*),
  • URL de l'image de la photo de profil : "has_profile_pic":(.*),
  • Le compte masque-t-il le nombre de likes et de vues : "hide_like_and_view_counts":(.*),
  • URL de la photo de profil : "profile_pic_url":(.*),
  • URL de la photo HD de profil : profile_pic_url_hd":"(.*)"
  • Nom de l'utilisateur : "username":"(.*)"
  • Ce compte est-il un compte supervisé par un tiers : "is_supervised_user":(.*),
  • Le supervision est elle activée : "is_supervision_enabled":(.*),
  • Titre de la page : {"title":"(.*)"
  • Le favicon : "favicon":(.*)}?
  • Le nom de l'utilisateur : "username":"(.*)"}?
  • L'utilisateur autorise-t-il le suivi par hashtags : data":{"biography".*can_follow_hashtag":(.*),

Vous retrouverez ici tous mes articles explicatifs de mes concepts, mes résultats d'analyses techniques m'ayant permi d'aboutir à un fonctionnement de mes applicatifs très fonctionnel

Rapport sondage marche

Voici le rapport statistique du sondage (auquel vous pouvez toujours répondre) que j'ai lancé sur le sujet

Mon GitHub

Voyant que l'intégration du flux RSS ralentissait tout mon site, voisi le simple lien de mon flux RSS : Mon GitHub