一. Apache-Echarts 简介数据可视化在过去的几年中得到了长足的发展。开发者对于可视化产品的期待不再是简单的图表创建工具,而在交互、性能、数据处理等方面有了更高级的需求。 Apache ECharts 始终致力于让开发者以更方便的方式创造灵活丰富的可视化作品。在最新推出的 Apache ECharts 5,我们着力加强了图表的叙事能力,让开发者可以以更简单的方式,讲述数据背后的故事。 “表·达”是 Apache ECharts 5 的核心,通过五大模块、十五项特性的全面升级,围绕可视化作品的叙事表达能力,让图“表”更能传“达”数据背后的故事,帮助开发者更轻松地创造满足各种场景需求的可视化作品。 其一是个基于 JavaScript 的 <span style="color:red">开源可视化图表库。 二. 小红书喜欢数实例1.在 Echarts 平台中选取一个合适钟意的图我这里选圆角环形图点击下载示例 保存到 main.js 爬虫代码同级目录,pie-borderRadius.html: 123456789101112131415161718 ...
小红书爬虫代码一. 在要保存代码的目录下新建 main.js1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798const playwright = require("playwright");const axios = require("axios");const fs = require("fs");(async () => { const browser = await playwright.chromium.launch({ headless: false }); // 设为 false 以便调试 const context = await browser.new ...
JSON 的基础使用一. JSON 简介JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它是 JavaScript 的子集,易于人阅读和编写。 JSON 用来存储和交换文本信息,比 xml 更小/更快/更易解析,易于读写,占用带宽小,网络传输速度快的特性,适用于数据量大,不要求保留原有类型的情况。。 前端和后端进行数据交互,其实就是 JS 和 Python 进行数据交互! 二. JSON 语法规则 名称必须用双引号(即:” “)来包括 值可以是双引号包括的字符串、数字、true、false、null、JavaScript 数组或子对象 数据在 name/value 中 数据见用逗号分隔 花括号保存对象 方括号保存数组 三. JSON 数据类型一并列举出 Python 与 JSON 数据类型的映射关系: Python JSON — — dict object list, tuple array str, unicode string int, long, float number ...
FastApi一. 简介FastAPI 是一个用于构建 API 的现代、快速(高性能)的 web 框架,使用 Python 并基于标准的 Python 类型提示。 二. 特性 快速:可与 NodeJS 和 Go 并肩的极高性能(归功于 Starlette 和 Pydantic)。最快的 Python web 框架之一。 高效编码:提高功能开发速度约 200% 至 300%。* 更少 bug:减少约 40% 的人为(开发者)导致错误。* 智能:极佳的编辑器支持。处处皆可自动补全,减少调试时间。 简单:设计的易于使用和学习,阅读文档的时间更短。 简短:使代码重复最小化。通过不同的参数声明实现丰富功能。bug 更少。 健壮:生产可用级别的代码。还有自动生成的交互式文档。 标准化:基于(并完全兼容)API 的相关开放标准:OpenAPI (以前被称为 Swagger) 和 JSON Schema。 三. 安装1. 安装 fastapi 模块1pip install fastapi 2. 安装 ASGI 服务器( Uvicorn 或者 Hypercorn)1pip install " ...
Python 数据库一. 数据库简介Python 标准数据库接口为 Python DB-API,Python DB-API为开发人员提供了数据库应用编程接口。 Python 数据库接口支持非常多的数据库,你可以选择适合你项目的数据库: GadFly mSQL MySQL PostgreSQL Microsoft SQL Server 2000 Informix Interbase Oracle Sybase 不同的数据库你需要下载不同的DB API模块,例如你需要访问Oracle数据库和Mysql数据,你需要下载Oracle和MySQL数据库模块。 DB-API 是一个规范. 它定义了一系列必须的对象和数据库存取方式, 以便为各种各样的底层数据库系统和多种多样的数据库接口程序提供一致的访问接口 。 而Python的DB-API,为大多数的数据库实现了接口,使用它连接各数据库后,就可以用相同的方式操作各数据库。 Python DB-API使用流程: 引入 API 模块 获取与数据库的连接 执行SQL语句和存储过程 关闭数据库连接 这里我们使用MySQL数据库 二. MySQLdbM ...
大学生涯
未读Scrapy一. Scrapy 简介Scrapy 是一个用于抓取网站和提取结构化数据的应用程序框架,可用于各种有用的应用程序,如数据挖掘、信息处理或历史存档。 尽管 Scrapy 最初是为网络抓取设计的,但它也可以用于使用 API(如 Amazon Associates Web Services)提取数据,或用作通用网络爬虫。 其支持: 使用扩展 CSS 选择器和 XPath 表达式,以及使用正则表达式进行提取的帮助器方法,内置支持从 HTML/XML 源中选择和提取数据。 一个交互式外壳控制台(IPython 识别),用于尝试 CSS 和 XPath 表达式以抓取数据,在编写或调试爬虫时非常有用。 内置支持生成信息导出,格式多样(JSON、CSV、XML),并将其存储在多个后端(FTP、S3、本地文件系统)中。 强大的编码支持和自动检测,用于处理外来、非标准和损坏的编码声明。 强大的可扩展性支持,允许您使用信号和明确定义的 API(中间件、扩展和管道)插入您自己的功能。 用于处理的内置扩展和中间件范围广泛 cookie 和会话处理 HTTP 功能,如压缩、身份 ...
一. 正则1. 正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。 re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。常用函数有: 1> re.match函数re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match() 就返回 none。 1re.match(pattern, string, flags=0) 函数参数说明: 参数 描述 pattern 匹配的正则表达式 string 要匹配的字符串。 flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 匹配成功 re.match 方法返回一个匹配的对象,否则返回 None。 123import reprint(re.match('www', 'www.baidu.com').span( ...
一. 选择器1. 标签选择器 选择器 例子 描述 element p/div/span 选择所有含有指定标签的元素 123456789101112131415161718192021222324 <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Document</title> <style> div { color: red; } span { color: blue; } p ...
课外开发
未读远程仓库一. 配置远程连接本地 Git 仓库和 GitHub 仓库之间的传输是 <span style="color:red">通过 SSH 加密传输的,所以需要配置 ssh key。 二. 添加远程仓库要将本地代码库连接到远程仓库,可以使用以下 git 命令: 首先,将本地代码库初始化为 Git 仓库(如果尚未完成) 1git init 添加远程仓库的 URL,其中 <remote-name>是自定义名称,<remote-url>是远程仓库的 URL 1git remote add <remote-name> <remote-url> 可以使用以下命令确认远程仓库是否已成功添加 1git remote -v 此后,您就可以使用 git push 命令将代码推送到远程仓库,或使用 git pull 命令从远程仓库拉取代码。 推送本地仓库内容到远程仓库 如果是新建的远程仓库,即远程仓库是空的时候,要加上-u 参数 1git push -u origin master 如果仓库不是空的, ...
面向对象一. 内置内属性 属性 定义 dict 类的属性(包含一个字典,由类的数据属性组成) doc 类的文档字符串 name 类名 module 类定义所在的模块(类的全名是’main.className’,如果类位于一个导入模块mymod中,那么className.module 等于 mymod) bases 类的所有父类构成元素(包含了一个由所有父类组成的元组) 123456789101112131415161718# 实例 1class Employee: """所有员工的基类""" empCount = 0 def __init__(self, name, salary): self.name = name self.salary = salary Employee.empCount += 1 def displayCount(self): print("Total Employee %d&qu ...