ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.8 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://english.news.cn/20260317/cfaaddb8ef5849bebf62872f1d648f6e/c.html | |||||||||||||||||||||||||||
| Last Crawled | 2026-05-10 00:08:06 (24 days ago) | |||||||||||||||||||||||||||
| First Indexed | 2026-03-17 17:32:13 (2 months ago) | |||||||||||||||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||||||||||||||
| Content | ||||||||||||||||||||||||||||
| Meta Title | GLOBALink | Foreign student embraces business-friendly environment in China's Hangzhou-Xinhua | |||||||||||||||||||||||||||
| Meta Description | GLOBALink | Foreign student embraces business-friendly environment in China's Hangzhou- | |||||||||||||||||||||||||||
| Meta Canonical | null | |||||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||||||||||||||
| ML Classification | ||||||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/News": 600,
"/Business_and_Industrial": 563,
"/News/Business_News": 334,
"/Jobs_and_Education": 230,
"/News/Business_News/Company_News": 222,
"/Business_and_Industrial/Business_Services": 204,
"/People_and_Society": 167,
"/Travel_and_Transportation": 114,
"/Jobs_and_Education/Jobs": 105
} | |||||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 705,
"/Article/News_Update": 644
} | |||||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 997
} | |||||||||||||||||||||||||||
| Content Metadata | ||||||||||||||||||||||||||||
| Language | en | |||||||||||||||||||||||||||
| Author | null | |||||||||||||||||||||||||||
| Publish Time | not set | |||||||||||||||||||||||||||
| Original Publish Time | 2026-03-17 17:32:13 (2 months ago) | |||||||||||||||||||||||||||
| Republished | No | |||||||||||||||||||||||||||
| Word Count (Total) | 367 | |||||||||||||||||||||||||||
| Word Count (Content) | 42 | |||||||||||||||||||||||||||
| Links | ||||||||||||||||||||||||||||
| External Links | 32 | |||||||||||||||||||||||||||
| Internal Links | 57 | |||||||||||||||||||||||||||
| Technical SEO | ||||||||||||||||||||||||||||
| Meta Nofollow | No | |||||||||||||||||||||||||||
| Meta Noarchive | No | |||||||||||||||||||||||||||
| JS Rendered | Yes | |||||||||||||||||||||||||||
| Redirect Target | null | |||||||||||||||||||||||||||
| Performance | ||||||||||||||||||||||||||||
| Download Time (ms) | 693 | |||||||||||||||||||||||||||
| TTFB (ms) | 692 | |||||||||||||||||||||||||||
| Download Size (bytes) | 3,708 | |||||||||||||||||||||||||||
| Location | ||||||||||||||||||||||||||||
| Host ID | 29 (laksa029) | |||||||||||||||||||||||||||
| Partition ID | 81 | |||||||||||||||||||||||||||
| Root Hash | 16448058665617576229 | |||||||||||||||||||||||||||
| Unparsed URL | cn,news!english,/20260317/cfaaddb8ef5849bebf62872f1d648f6e/c.html s443 | |||||||||||||||||||||||||||