ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.4 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | http://www.news.cn/politics/20240422/d061ba8ecd674cfc8777b9d5922759ad/c.html | ||||||||||||||||||
| Last Crawled | 2026-05-21 16:42:39 (13 days ago) | ||||||||||||||||||
| First Indexed | 2024-04-21 23:48:55 (2 years ago) | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | 清淡饮食就是吃素吗?这份健康饮食指南请收-新华网 | ||||||||||||||||||
| Meta Description | 清淡饮食就是吃素吗?这份健康饮食指南请收-"食物多样化是根本原则究竟什么才是真正的清淡饮食呢。" | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/Health": 970,
"/Health/Nutrition": 967,
"/Health/Nutrition/Special_and_Restricted_Diets": 777,
"/Food_and_Drink": 212,
"/Food_and_Drink/Cooking_and_Recipes": 170,
"/Food_and_Drink/Cooking_and_Recipes/Healthy_Eating": 168
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 999,
"/Article/Tutorial_or_Guide": 889
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | null | ||||||||||||||||||
| Author | null | ||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||
| Original Publish Time | 2024-04-21 23:48:55 (2 years ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 325 | ||||||||||||||||||
| Word Count (Content) | 11 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 36 | ||||||||||||||||||
| Internal Links | 210 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 372 | ||||||||||||||||||
| TTFB (ms) | 372 | ||||||||||||||||||
| Download Size (bytes) | 5,217 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 29 (laksa029) | ||||||||||||||||||
| Partition ID | 81 | ||||||||||||||||||
| Root Hash | 16448058665617576229 | ||||||||||||||||||
| Unparsed URL | cn,news!www,/politics/20240422/d061ba8ecd674cfc8777b9d5922759ad/c.html h80 | ||||||||||||||||||