ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | FAIL | download_stamp > now() - 6 MONTH | 7.6 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.bbc.co.uk/programmes/w3ct1d1b | |||||||||||||||||||||||||||
| Last Crawled | 2025-10-16 21:15:41 (7 months ago) | |||||||||||||||||||||||||||
| First Indexed | 2021-01-03 10:17:05 (5 years ago) | |||||||||||||||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||||||||||||||
| Content | ||||||||||||||||||||||||||||
| Meta Title | BBC World Service - The Documentary, Donald Trump: The man | |||||||||||||||||||||||||||
| Meta Description | The businessman and TV show host who became the 45th President of the United States | |||||||||||||||||||||||||||
| Meta Canonical | null | |||||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| ML Classification | ||||||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/People_and_Society": 553,
"/People_and_Society/Social_Sciences": 445,
"/People_and_Society/Social_Sciences/Political_Science": 364,
"/News": 246,
"/News/Politics": 221,
"/Arts_and_Entertainment": 187,
"/Arts_and_Entertainment/TV_and_Video": 132,
"/News/Politics/Campaigns_and_Elections": 132,
"/Arts_and_Entertainment/TV_and_Video/TV_Shows_and_Programs": 111
} | |||||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Audio": 546,
"/Audio/Podcast": 359
} | |||||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 988
} | |||||||||||||||||||||||||||
| Content Metadata | ||||||||||||||||||||||||||||
| Language | en-gb | |||||||||||||||||||||||||||
| Author | null | |||||||||||||||||||||||||||
| Publish Time | not set | |||||||||||||||||||||||||||
| Original Publish Time | 2021-01-03 10:17:05 (5 years ago) | |||||||||||||||||||||||||||
| Republished | No | |||||||||||||||||||||||||||
| Word Count (Total) | 342 | |||||||||||||||||||||||||||
| Word Count (Content) | 0 | |||||||||||||||||||||||||||
| Links | ||||||||||||||||||||||||||||
| External Links | 4 | |||||||||||||||||||||||||||
| Internal Links | 44 | |||||||||||||||||||||||||||
| Technical SEO | ||||||||||||||||||||||||||||
| Meta Nofollow | No | |||||||||||||||||||||||||||
| Meta Noarchive | No | |||||||||||||||||||||||||||
| JS Rendered | Yes | |||||||||||||||||||||||||||
| Redirect Target | null | |||||||||||||||||||||||||||
| Performance | ||||||||||||||||||||||||||||
| Download Time (ms) | 307 | |||||||||||||||||||||||||||
| TTFB (ms) | 306 | |||||||||||||||||||||||||||
| Download Size (bytes) | 29,180 | |||||||||||||||||||||||||||
| Location | ||||||||||||||||||||||||||||
| Host ID | 132 (laksa132) | |||||||||||||||||||||||||||
| Partition ID | 81 | |||||||||||||||||||||||||||
| Root Hash | 2272746388958996332 | |||||||||||||||||||||||||||
| Unparsed URL | uk,co,bbc!www,/programmes/w3ct1d1b s443 | |||||||||||||||||||||||||||