ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 2.8 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.bbc.com/news/articles/cx2500p3qjyo | ||||||||||||||||||
| Last Crawled | 2026-03-12 11:04:50 (2 months ago) | ||||||||||||||||||
| First Indexed | 2025-09-12 12:24:22 (8 months ago) | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | South Park episode lampooning Charlie Kirk pulled from Comedy Central | ||||||||||||||||||
| Meta Description | The one with the character Clyde Donovan has been cut from Comedy Central but remains on Paramount+. | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/Arts_and_Entertainment": 900,
"/Arts_and_Entertainment/TV_and_Video": 881,
"/Arts_and_Entertainment/TV_and_Video/TV_Shows_and_Programs": 867,
"/News": 389,
"/News/Gossip_and_Tabloid_News": 253,
"/News/Gossip_and_Tabloid_News/Scandals_and_Investigations": 176
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 994,
"/Article/News_Update": 992
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 982
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | en-gb | ||||||||||||||||||
| Author | Paul Glynn | ||||||||||||||||||
| Publish Time | 2025-09-12 11:02:31 (8 months ago) | ||||||||||||||||||
| Original Publish Time | 2025-09-12 11:02:31 (8 months ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 1,150 | ||||||||||||||||||
| Word Count (Content) | 509 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 23 | ||||||||||||||||||
| Internal Links | 144 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 226 | ||||||||||||||||||
| TTFB (ms) | 225 | ||||||||||||||||||
| Download Size (bytes) | 49,332 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 16 (laksa016) | ||||||||||||||||||
| Partition ID | 5 | ||||||||||||||||||
| Root Hash | 1643509356818581016 | ||||||||||||||||||
| Unparsed URL | com,bbc!www,/news/articles/cx2500p3qjyo s443 | ||||||||||||||||||