ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 8.1 months ago (distributed domain, exempt) |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.instagram.com/reel/DOTBG3PjFhA/ | ||||||||||||||||||||||||
| Last Crawled | 2025-10-02 16:29:18 (8 months ago) | ||||||||||||||||||||||||
| First Indexed | not set | ||||||||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||||||||
| Content | |||||||||||||||||||||||||
| Meta Title | |||||||||||||||||||||||||
| Meta Description | 84K likes, 734 comments - princeandprincessofwales on September 7, 2025: "A great day yesterday at the Women’s @rugbyworldcup! From Exeter to Brighton, it was great to see @welshrugbyunion and @redrosesrugby in action. 🏉🏴🏴". | ||||||||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| ML Classification | |||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Online_Communities": 854,
"/Sports": 640,
"/Sports/Team_Sports": 616,
"/Sports/Team_Sports/Rugby": 560,
"/Online_Communities/Social_Networks": 451,
"/People_and_Society": 146,
"/Internet_and_Telecom": 114,
"/Internet_and_Telecom/Web_Services": 104
} | ||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/User_Generated_Content": 518,
"/User_Generated_Content/Social_Media_Post": 505
} | ||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Navigational": 734,
"Informational": 252
} | ||||||||||||||||||||||||
| Content Metadata | |||||||||||||||||||||||||
| Language | en | ||||||||||||||||||||||||
| Author | null | ||||||||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||||||||
| Original Publish Time | 2025-10-02 16:29:18 (8 months ago) | ||||||||||||||||||||||||
| Republished | No | ||||||||||||||||||||||||
| Word Count (Total) | 1 | ||||||||||||||||||||||||
| Word Count (Content) | 1 | ||||||||||||||||||||||||
| Links | |||||||||||||||||||||||||
| External Links | 0 | ||||||||||||||||||||||||
| Internal Links | 0 | ||||||||||||||||||||||||
| Technical SEO | |||||||||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||||||||
| Meta Noarchive | Yes | ||||||||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||||||||
| Performance | |||||||||||||||||||||||||
| Download Time (ms) | 777 | ||||||||||||||||||||||||
| TTFB (ms) | 407 | ||||||||||||||||||||||||
| Download Size (bytes) | 113,617 | ||||||||||||||||||||||||
| Location | |||||||||||||||||||||||||
| Host ID | 60 (laksa060) | ||||||||||||||||||||||||
| Partition ID | 22 | ||||||||||||||||||||||||
| Root Hash | 6480031282484104460 | ||||||||||||||||||||||||
| Unparsed URL | com,instagram!www,/reel/DOTBG3PjFhA/ s443 | ||||||||||||||||||||||||