Une fois n'est pas coutume, je ne vais pas vous présenter dans cet article de code à proprement parler, mais nous allons vous interdit sur un ensemble d'expressions rationnelles, de nous appelons dans notre jargon d'informaticien des regex ou expressions régulières qui vont nous permettre de pouvoir extraire, à partir d'une page d'un compte Instagram, un ensemble d'informations fort intéressantes, susceptibles d'être réutilisées, par exemple, pour afficher sur un site internet tiers des informations à jour d'un compte Instagram donné.
- Type du profil instagram : <meta property="og:type".*content="(.*)"
- URL de l'image du compte : <meta property="og:image".*content="(.*)"
- Titre de la page : <meta property="og:title".*content="(.*)"
- URL de la page Instagram : <meta property="og:url".*content="(.*)"
- Description de la page Instagram : <meta property="og:description".*content="(.*)"
- Meta contenu: <meta content="(.*)".*name="description"
- Autorisation de bots de crawl (la page autorise t elle les bots à grabber la page) : \["InstagramSEOCrawlBot".*{.*is_allowlisted_crawl_bot":(.*),?"
- Autorisation du bot de google crawl (Autorisation des bot SSL) : "is_crawler_with_ssr".*:(.*),?"
- Autorisation bot derriere un proxy : "is_crawler_with_relay".*:(.*),?"
- Biographie de l'auteur du compte (mais necessite un "nettoyage" de la chaine rtournée en JSON et un décodage uuencode) : {"data":{"biography":"(.*)"
- Catégorie/type du compte : "category_name":"(.*)"
- Nom complet du compte : "full_name":"(.*)"
- Le compte possède-t-il un numéro de téléphone, et si oui, lequel : "has_phone_number":(.*),
- URL de l'image de la photo de profil : "has_profile_pic":(.*),
- Le compte masque-t-il le nombre de likes et de vues : "hide_like_and_view_counts":(.*),
- URL de la photo de profil : "profile_pic_url":(.*),
- URL de la photo HD de profil : profile_pic_url_hd":"(.*)"
- Nom de l'utilisateur : "username":"(.*)"
- Ce compte est-il un compte supervisé par un tiers : "is_supervised_user":(.*),
- Le supervision est elle activée : "is_supervision_enabled":(.*),
- Titre de la page : {"title":"(.*)"
- Le favicon : "favicon":(.*)}?
- Le nom de l'utilisateur : "username":"(.*)"}?
- L'utilisateur autorise-t-il le suivi par hashtags : data":{"biography".*can_follow_hashtag":(.*),
