ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 8.1 months ago (distributed domain, exempt) |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.instagram.com/nytimes/ | ||||||||||||||||||
| Last Crawled | 2025-10-02 15:06:16 (8 months ago) | ||||||||||||||||||
| First Indexed | 2015-12-31 10:26:43 (10 years ago) | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | The New York Times (@nytimes) • Instagram photos and videos | ||||||||||||||||||
| Meta Description | 20M Followers, 629 Following, 22K Posts - The New York Times (@nytimes) on Instagram: "We seek the truth and help people understand the world." | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/News": 854,
"/Online_Communities": 296,
"/News/Other": 252,
"/People_and_Society": 204,
"/Online_Communities/Photo_and_Video_Sharing": 136,
"/Online_Communities/Photo_and_Video_Sharing/Photo_and_Image_Sharing": 127
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Image": 275,
"/Image/Photography": 222
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Navigational": 908
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | en | ||||||||||||||||||
| Author | null | ||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||
| Original Publish Time | 2015-12-31 10:26:43 (10 years ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 10 | ||||||||||||||||||
| Word Count (Content) | 10 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 0 | ||||||||||||||||||
| Internal Links | 0 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||
| Meta Noarchive | Yes | ||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 604 | ||||||||||||||||||
| TTFB (ms) | 340 | ||||||||||||||||||
| Download Size (bytes) | 133,572 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 60 (laksa060) | ||||||||||||||||||
| Partition ID | 22 | ||||||||||||||||||
| Root Hash | 6480031282484104460 | ||||||||||||||||||
| Unparsed URL | com,instagram!www,/nytimes/ s443 | ||||||||||||||||||