顾乔芝士网

持续更新的前后端开发技术栈

2025年07月02日

Java爬虫

Java 爬虫技术解析与实践

在互联网时代，Java 爬虫技术成为数据采集的重要手段。通过模拟网络请求、解析网页内容，爬虫能够自动化地从网页获取结构化数据，为企业决策、学术研究、舆情分析等众多领域提供支撑。

Java 爬虫实现原理

Java 爬虫主要通过以下几个步骤实现数据采集：首先是发起请求，爬虫从初始 URL 开始，通过 Java 的网络编程工具库（如 HttpURLConnection、Apache HttpClient 等）向服务器发送 HTTP 请求，获取网页数据。然后是接收响应，服务器返回包含网页内容及元信息的 HTTP 响应，爬虫从中提取 HTML 页面等数据。接着是解析内容，利用 Java 的网页解析库（如 Jsoup、HtmlUnit 等）将 HTML 页面解析为 DOM 树结构，提取目标信息，如链接、文本、图片等。之后是提取链接，爬虫识别页面中的链接，并将其添加到待访问队列，以便递归爬取，直至没有新链接为止。

2025年07月02日

java使用spring mvc开发微信公众号获取token

上一节我们说到验证开发者的服务器的步骤，由于官方提供的只是php部分的源码，对于不懂PHP的服务器部署可能不知道怎么处理，所以我就写了java的验证服务器的源码，今天我继续进行微信公众号的开发，获取token，如果对我的文章感兴趣，欢迎订阅我的头条号：一点热，www.yeehot.com

上一节文章快速入口

2025年07月02日

Nginx配置详解FTP搭建静态文件https服务器

目录

Nginx配置详解

2025年07月02日

通过端口查找进程的完整操作指南

一、Windows 系统操作方法

查看端口占用进程

2025年07月02日

java实现文件上传到服务器

java实现文件上传到服务器，java实现大文件上传，java实现大文件分块上传，java实现大文件分片上传，java实现大文件切片上传，java实现大文件批量上传，java实现大文件加密上传，java实现文件夹上传，java实现大文件上传解决方案，java实现大文件上传思路，

后端用的JAVA，JSP，SpringBoot，前端用了JSP，VUE2，VUE3，React，需要实现大文件的上传和下载。

2025年07月02日

使用java做爬虫获取网络资源下载403错误解决办法

前言：

在做爬虫的时候，有时候需要下载爬到连接的URL。

比如：String url = “
http://www.kaigejava.com/uplode/pdf/xxxxx.pdf";

如果使用File file = new File(url );

发现file处理后成了：http:\www.kaigejava.com\uplode\pdf\xxxxx.pdf

2025年07月02日

python脚本查找java类所属jar包

java开发或者服务器日志中偶尔会遇到某个类找不到，或者知道大概的class名字，但是不确定输入哪个jar包，想从本地maven仓库或者私服中查找？

查找某个类所属jar包

2025年07月02日

很棒，简单而纯粹的安卓手机文件管理器

说到安卓手机文件管理器，目前比较流行的有：ES文件管理器、MiXplorer、MT管理器、RE管理器，以及手机系统基本上也自带了一个文件管理器。不过这些管理器功能过于复杂，繁琐，对于一些小伙伴来说，文件管理器就好好的管理文件就行了，不需要太多功能。

2025年07月02日

Java后端学习路线是什么?

关于 Java 后端（Spring Boot 为主）学习路线：

一、Java 基础阶段

2025年07月02日

windows系统的服务器快速部署java项目环境地址

1、
mysql:https://dev.mysql.com/downloads/mysql/（msi安装包）

2、
redis:https://github.com/tporadowski/redis/releases(msi安装包)

3、nginx:本地的改改配置即可（运行闪退正常）

<< < 1 2 3 > >>

控制面板: 您好，欢迎到访网站！
登录后台查看权限

网站分类

技术文章

最新留言

蜀ICP备2024111239号-33