从markdown到nga bbscode的转换程序

从markdown到nga bbscode的转换程序

NGA(艾泽拉斯国家地理)论坛使用一种自定义的名为 bbscode 的代码来排版帖子内容,类似HTML,它也是一种标记语言,对bbscode的详细介绍可见:[NGA常用BBS代码][奥运帖]Project N —— 《从入门到精通:排版的艺术 Ver.3》

这种论坛自定义标记语言可以和markdown、html进行相互转换。例子如下:

1
2
3
4
5
6
7
[h]标题[/h]
[b]加粗文字[/b]
[list]
[*] 列表项
[*] 列表项
[/list]
[quote]引用块[/quote]

在使用NGA论坛的时候遇到了将markdown文本转换为bbscode的需求,所以打算用python写一个简单的转换程序。由于不涉及复杂的GUI,本项目使用tkinter来编写界面。

项目地址:

阅读更多
scrapy+selenium爬取智联招聘

scrapy+selenium爬取智联招聘

这是第三个大四综合实践——数据处理与分析。我们小组打算爬取各个招聘网站进行数据分析。

我负责其中的爬虫模块,教了两个队友怎么使用scrapy,打算我解决完爬取数据的一些难题之后,剩余的解析就交给他们。

我觉得解析数据只是苦力活,只要爬取到带有数据的html,剩下的就很轻松了。最后我选择使用selenium,这样就不用分析接口了,两个刚学爬虫的队友也能轻松搞定。

很快地搞定了前程无忧网和拉勾网之后,我在爬取智联招聘网遇到了很多问题。本文将这些问题以及解决方案记录下来,供读者参考。

阅读更多
vscode中python自定义包的模块如何导入其子包模块

vscode中python自定义包的模块如何导入其子包模块

问题描述

如图所示,对于python,有一个自定义包parent,它里面还有一个子包child,当你在parent.module1import child.module2时,vscode会给你报错,说找不到这个包。

当你单独运行module1.py的时候,可以正常运行,但是当你在parent包外层的main.pyimport parent.module1时,就会报错。

阅读更多
【作业总结】python写的DES替代算法的gui小工具

Scrapy爬虫框架(1)一个简单的可用的爬虫

很久没写爬虫了,又重新开始使用 scrapy,之前学习的内容基本上都忘了,重新复习一遍,发现对它的理解又加深了一些。

本文将初级知识点简单梳理,实现了一个 HelloWorld 级别的 Scrapy 爬虫。

本文适用于 Scrapy 1.6.0,结合了自己的理解,可能理解有错误,欢迎在下面评论区指出。

不包含安装教程。

阅读更多

【课设总结】基于LAN的即时通信软件

本学期开了计算机网络课程,期末的课程设计我选了这个题目——基于 LAN 的即时通讯软件,题目就只有这么短,剩下的全部自己发挥,不限平台不限语言。

由于以前自学过 c++网络编程,写了个简易的聊天室(bug 百出),所有刚开始也想用 c++来写,新建了 MFC 项目正在画界面的时候,才想起今时不同往日,我会的语言不止 c++了,还有 java 和 python。最后决定用 python,虽说 java 写的可能以后会更好扩展更好维护一些,但是 python 写起来应该会更加轻松(个人看法)。

本文基于我当时写的课设报告,在之后可能会将其中学到的知识整理成其他的博文,并在此文中列出。

b 站视频已上传:【课设思路分享】基于 LAN 的即时通讯软件

对应 github 库传送门:simuqq

比较长,配合侧边栏目录食用。

阅读更多

爬取微信公众号文章1获取文章链接

爬取微信公众号的文章,之前一直觉得应该很难,我搞不定,但是尝试了一下发现,其实这和之前爬取的网站没有太大的区别。

本文记录了 2019 年 8 月 7 日爬取某一特定微信公众号的所有文章链接的方式,读者请注意时效性。

阅读更多

简易密码生成器

为了管理自己平时各种各样的账号密码,我使用了一个加密了的 xlsx 文件来记录,同时使用了密码生成规则。为了方便生成密码,使用 python 写了一个小工具。

由于代码比较简单,因此不做过多说明,仅做记录。

阅读更多