ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.4 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | http://www.news.cn/world/20250912/a26afd43d06b4ef09213fc5630ab9cbe/c.html | |||||||||||||||||||||||||||
| Last Crawled | 2026-05-21 21:30:09 (12 days ago) | |||||||||||||||||||||||||||
| First Indexed | 2025-09-12 13:07:15 (8 months ago) | |||||||||||||||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||||||||||||||
| Content | ||||||||||||||||||||||||||||
| Meta Title | 国际观察丨小小移民船,英国大麻烦-新华网 | |||||||||||||||||||||||||||
| Meta Description | 国际观察丨小小移民船,英国大麻烦- | |||||||||||||||||||||||||||
| Meta Canonical | null | |||||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| ML Classification | ||||||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Law_and_Government": 610,
"/News": 497,
"/Law_and_Government/Legal": 419,
"/News/Politics": 344,
"/People_and_Society": 311,
"/People_and_Society/Social_Issues_and_Advocacy": 305,
"/News/Politics/Campaigns_and_Elections": 235,
"/People_and_Society/Social_Issues_and_Advocacy/Work_and_Labor_Issues": 223,
"/Law_and_Government/Legal/Other": 205
} | |||||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 998,
"/Article/News_Update": 927
} | |||||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | |||||||||||||||||||||||||||
| Content Metadata | ||||||||||||||||||||||||||||
| Language | null | |||||||||||||||||||||||||||
| Author | null | |||||||||||||||||||||||||||
| Publish Time | not set | |||||||||||||||||||||||||||
| Original Publish Time | 2025-09-12 13:07:15 (8 months ago) | |||||||||||||||||||||||||||
| Republished | No | |||||||||||||||||||||||||||
| Word Count (Total) | 344 | |||||||||||||||||||||||||||
| Word Count (Content) | 34 | |||||||||||||||||||||||||||
| Links | ||||||||||||||||||||||||||||
| External Links | 37 | |||||||||||||||||||||||||||
| Internal Links | 203 | |||||||||||||||||||||||||||
| Technical SEO | ||||||||||||||||||||||||||||
| Meta Nofollow | No | |||||||||||||||||||||||||||
| Meta Noarchive | No | |||||||||||||||||||||||||||
| JS Rendered | Yes | |||||||||||||||||||||||||||
| Redirect Target | null | |||||||||||||||||||||||||||
| Performance | ||||||||||||||||||||||||||||
| Download Time (ms) | 597 | |||||||||||||||||||||||||||
| TTFB (ms) | 596 | |||||||||||||||||||||||||||
| Download Size (bytes) | 6,834 | |||||||||||||||||||||||||||
| Location | ||||||||||||||||||||||||||||
| Host ID | 29 (laksa029) | |||||||||||||||||||||||||||
| Partition ID | 81 | |||||||||||||||||||||||||||
| Root Hash | 16448058665617576229 | |||||||||||||||||||||||||||
| Unparsed URL | cn,news!www,/world/20250912/a26afd43d06b4ef09213fc5630ab9cbe/c.html h80 | |||||||||||||||||||||||||||