ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.4 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://english.www.gov.cn/news/202501/06/content_WS677b291ec6d0868f4e8ee889.html | |||||||||||||||
| Last Crawled | 2026-05-22 15:06:43 (11 days ago) | |||||||||||||||
| First Indexed | 2025-01-06 12:55:07 (1 year ago) | |||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||
| Content | ||||||||||||||||
| Meta Title | 41st Harbin Int'l Ice and Snow Festival kicks off | |||||||||||||||
| Meta Description | null | |||||||||||||||
| Meta Canonical | null | |||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||
| ML Classification | ||||||||||||||||
| ML Categories |
Raw JSON{
"/Sports": 698,
"/Sports/Winter_Sports": 682,
"/Arts_and_Entertainment": 370,
"/Arts_and_Entertainment/Events_and_Listings": 364,
"/Arts_and_Entertainment/Events_and_Listings/Expos_and_Conventions": 126
} | |||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 975,
"/Article/News_Update": 949
} | |||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 992
} | |||||||||||||||
| Content Metadata | ||||||||||||||||
| Language | null | |||||||||||||||
| Author | 孙美真 | |||||||||||||||
| Publish Time | not set | |||||||||||||||
| Original Publish Time | 2025-01-06 12:55:07 (1 year ago) | |||||||||||||||
| Republished | No | |||||||||||||||
| Word Count (Total) | 627 | |||||||||||||||
| Word Count (Content) | 589 | |||||||||||||||
| Links | ||||||||||||||||
| External Links | 1 | |||||||||||||||
| Internal Links | 10 | |||||||||||||||
| Technical SEO | ||||||||||||||||
| Meta Nofollow | No | |||||||||||||||
| Meta Noarchive | No | |||||||||||||||
| JS Rendered | Yes | |||||||||||||||
| Redirect Target | null | |||||||||||||||
| Performance | ||||||||||||||||
| Download Time (ms) | 416 | |||||||||||||||
| TTFB (ms) | 416 | |||||||||||||||
| Download Size (bytes) | 4,839 | |||||||||||||||
| Location | ||||||||||||||||
| Host ID | 171 (laksa171) | |||||||||||||||
| Partition ID | 16 | |||||||||||||||
| Root Hash | 561662822629363371 | |||||||||||||||
| Unparsed URL | cn,gov,www!english,/news/202501/06/content_WS677b291ec6d0868f4e8ee889.html s443 | |||||||||||||||