ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 3.2 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.idcpc.org.cn/english2023/chinadelights/festivals/202307/t20230719_153348.html | |||||||||||||||||||||||||||
| Last Crawled | 2026-02-25 14:11:49 (3 months ago) | |||||||||||||||||||||||||||
| First Indexed | 2024-09-29 22:57:28 (1 year ago) | |||||||||||||||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||||||||||||||
| Content | ||||||||||||||||||||||||||||
| Meta Title | Mid-Autumn Festival | |||||||||||||||||||||||||||
| Meta Description | null | |||||||||||||||||||||||||||
| Meta Canonical | null | |||||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| ML Classification | ||||||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/People_and_Society": 567,
"/Arts_and_Entertainment": 494,
"/Arts_and_Entertainment/Events_and_Listings": 457,
"/Arts_and_Entertainment/Events_and_Listings/Other": 278,
"/People_and_Society/Family_and_Relationships": 199,
"/People_and_Society/Family_and_Relationships/Family": 169,
"/People_and_Society/Family_and_Relationships/Family/Other": 130,
"/Travel_and_Transportation": 117,
"/Travel_and_Transportation/Tourist_Destinations": 100
} | |||||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 905,
"/Article/Story": 778
} | |||||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 970,
"Commercial": 146
} | |||||||||||||||||||||||||||
| Content Metadata | ||||||||||||||||||||||||||||
| Language | en | |||||||||||||||||||||||||||
| Author | null | |||||||||||||||||||||||||||
| Publish Time | not set | |||||||||||||||||||||||||||
| Original Publish Time | 2023-07-19 00:00:00 (2 years ago) | |||||||||||||||||||||||||||
| Republished | No | |||||||||||||||||||||||||||
| Word Count (Total) | 677 | |||||||||||||||||||||||||||
| Word Count (Content) | 454 | |||||||||||||||||||||||||||
| Links | ||||||||||||||||||||||||||||
| External Links | 12 | |||||||||||||||||||||||||||
| Internal Links | 50 | |||||||||||||||||||||||||||
| Technical SEO | ||||||||||||||||||||||||||||
| Meta Nofollow | No | |||||||||||||||||||||||||||
| Meta Noarchive | No | |||||||||||||||||||||||||||
| JS Rendered | Yes | |||||||||||||||||||||||||||
| Redirect Target | null | |||||||||||||||||||||||||||
| Performance | ||||||||||||||||||||||||||||
| Download Time (ms) | 958 | |||||||||||||||||||||||||||
| TTFB (ms) | 894 | |||||||||||||||||||||||||||
| Download Size (bytes) | 49,709 | |||||||||||||||||||||||||||
| Location | ||||||||||||||||||||||||||||
| Host ID | 185 (laksa185) | |||||||||||||||||||||||||||
| Partition ID | 99 | |||||||||||||||||||||||||||
| Root Hash | 10167510535462979985 | |||||||||||||||||||||||||||
| Unparsed URL | cn,org,idcpc!www,/english2023/chinadelights/festivals/202307/t20230719_153348.html s443 | |||||||||||||||||||||||||||