第020期 - 暮光潋滟,海上余晖
本期的封面也是来自我的好朋友 nilfunc
,这是一张来自广东汕头的日出,所以本期斗胆取名为“暮光潋滟,海上余晖”,同时也突破20期
之前都是四字的标题
>> 🤺大橘的技术交流
algolia 在当前版本应该如何配置到 Vitepress
⚠️ 这个交流可能只适合 2024-11-09 左右的 algolia 版本。
本周和大家加交流下最近使用 algolia 作为搜索引擎应该如何去集成到 algolia
首先批评并给大家看下 Vitepress 官网是如何教大家集成的
https://vitepress.dev/zh/reference/default-theme-search#algolia-search
简简单单甩一个代码给你,请问你这是要提高学习成本吗?
根据我的查阅和研究,目前网上我认为比较有用的两个教程
,其他要么就是太老,要么就是太捞,要么就是搜不到:
- 關於 algolia 在 vitepress 集成,踩雷過程
- 给 VitePress 添加 algolia 搜索
- How to Crawl Your Website Automatically Using GitHub Actions
下面阐述目前来说比较稳定的做法,
- 首先可以按照 Vitepress 官网填写相关的 config,这里就不过多阐述了:
export default defineConfig({
themeConfig: {
search: {
provider: 'algolia',
options: {
appId: '...',
apiKey: '...',
indexName: '...'
}
}
}
})
去
DOCSEARCH
申请一个爬取你博客或者其他的,algolia 大概会在 1~3 天给出邮件回复,你就可以开始建立搜索引擎了,顺便这里注册一下indexName
申请完以后,首先测试下是否有用,在第一步中有
...
是没有填写的,进入官网,然后填写后,有可能有的人找不到现在版本的地址在哪,这里给大家指路一下
进去之后在 Setting
就可以看到自己的appId
、apiKey
好,到这里就填写完成了,然后在 Crawler 这个界面下,点击 Configuration
的 Start URLs
,写上你的公网域名
备注:这里可以填写你自己的 rss.xml 地址,效果更佳
最后,去 Overview
点击一下 start crawling
,在这个页面下看见某个卡片在转圈,以及有 Success 了那就说明完成了。
- 之后也就是大家看到的在周刊内可以进行搜索,11月5日我也发了条tg证明这是可行的解决方案
algolia 的 Github Action
网上真的五花八门花里胡哨,给我弄得眼花缭乱,什么建立 crawlerConfig.json
,什么用 signcl/docsearch-scraper-action@master
,在当前版本的 algolia 都是扯淡
目前我认为公认的 algolia - GitHub Action 来自官方的 GitHub 仓库
Algolia Crawler Github action:algoliasearch-crawler-github-actions
这是官方写的一个示例,大家可以参考,至于怎么集成到 GitHub yml,都教到这步了会的自然懂了,不会的也用不上:
- name: Algolia crawler creation and crawl
uses: algolia/[email protected]
id: algolia_crawler
with: # mandatory parameters
crawler-user-id: ${{ secrets.CRAWLER_USER_ID }}
crawler-api-key: ${{ secrets.CRAWLER_API_KEY }}
algolia-app-id: ${{ secrets.ALGOLIA_APP_ID }}
algolia-api-key: ${{ secrets.ALGOLIA_API_KEY }}
site-url: 'https://example.com'
填写完CRAWLER_USER_ID
、CRAWLER_API_KEY
、 ALGOLIA_APP_ID
、ALGOLIA_API_KEY
,
ALGOLIA_APP_ID
、ALGOLIA_API_KEY
,也就是之前说的CRAWLER_USER_ID
、CRAWLER_API_KEY
位置比较刁钻,CRAWLER_USER_ID
、CRAWLER_API_KEY
依然是在上面第3步
的DataSource
下右边的Setting
关于如何使用 Github Action 进行顺序工作流部署
因为如果两个一起写的话那么他们是一起推送的,也就是你文章推出去、Algolia 也触发,那么可以写一个工作流等待文章推送了然后 Algolia 再触发,下面是一个示例:
解决思路:可以在 GitHub Actions 中设置一个 workflow 来等待另一个 workflow 完成后再执行。为此,可以利用 workflow_run 触发器,它会在指定 workflow 成功完成后自动触发另一个 workflow。
- 配置
deploy.yml
: 这是你想首先执行的 workflow。配置完成后,可以照常触发此 workflow
name: Deploy
on:
push:
branches:
- main
jobs:
deploy_job:
runs-on: ubuntu-latest
steps:
- name: Checkout code
uses: actions/checkout@v2
# 其他步骤...
- 配置
algolia.yml
: 在此 workflow 中使用 workflow_run 触发器,设置为在 deploy.yml 成功运行后再执行
name: AlgoliaSearch
on:
workflow_run:
workflows: ["Deploy"] # 指定 deploy.yml 的 name
types:
- completed # 仅在 deploy.yml 完成后触发
jobs:
algolia_job:
runs-on: ubuntu-latest
steps:
- name: Checkout code
uses: actions/checkout@v2
# 其他步骤...
🤺 至此,交流结束
>> 🎶边听边看
🎵 请选择你的音乐:
建国英雄登场的BGM(紧跟时事)
>> 🐈大橘的工具集
热点话题榜
实时追踪热点话题,一站式查看与搜索
Awesome-XiaoBOT
文档列出了 1854 个 小报童 内容,并按类别进行了分类。文档重点推荐了一些热门的 小报童 专栏,涵盖了互联网赚钱、自媒体运营、 AI 提示词、产品思考、 AIGC 变现、播客制作、小红书运营、 Reddit 营销等多个领域。文档鼓励用户积极投稿,并提供了一些实用信息,例如购买退款政策和内容质量反馈渠道
AI Hear
一款在您电脑本地运行的私有软件。一键开启多语种实时翻译,管理音频、译文和时间轴,即使身处没有网络的教室、地铁、商场或户外。不收集数据,保护隐私
Browser-Use
一个开源的 Web 自动化库,允许 LLM 通过简单的接口与网站交互。它支持多种 LLM 模型,可以执行各种网页操作,例如打开新标签页、搜索信息、提取数据等
在问
一个免费的在线聊天工具,旨在让用户更方便地享受科技带来的便利。用户可以使用我们的工具来获取答案、寻求建议、进行翻译和计算等等
ChatGPT search
ChatGPT推出自己的浏览器插件,可以直接在搜索栏进行搜索。设置为默认搜索引擎后,您可以直接通过浏览器 URL 栏进行搜索。要将查询重定向到 Google 搜索,请输入“!g [您的查询]”(例如!g foobar)直接在浏览器 URL 栏中
如果你懒得设置插件也可以使用:https://chatgpt.com/?q=xxx 其中,xxx 为你想要搜索的内容
云搭:低代码搭建小程序、H5、问卷、图文
一款功能强大、开源、免费的可视化搭建解决方案,它支持零代码搭建小程序、H5、问卷、图文等多种应用,我致力于提供一套简单、便捷、专业、可靠的多场景零代码平台
Pokemon Coloring Pages:宝可梦涂色页网站
内容来自网络上搜集的宝可梦图片,作者手动去掉颜色后加工成涂色页形式,而且所有涂色页均可免费下载,并且由于涂色页是手动处理的,更新速度较慢
Cellar Door:好听英语单词的排行榜网站
一个对最漂亮英语单词的排行榜网站 Cellar Door,里面列举了 100 个好看的单词
Keyviz:键盘可视化工具
一款免费开源的实时键鼠输入可视化软件,可以将用户的键盘和鼠标操作实时显示在屏幕上,方便演示和教学。该软件支持高度自定义的显示效果,用户可以根据自己的需求调整按键颜色、边框、显示位置和停留时间等。Keyviz 提供多种安装方式,包括直接下载、 Scoop 和 Winget 等包管理器
OpenTune
一个基于 Material Design 3 设计的 YouTube Music 开源 Android 客户端
Squawker:Twitter/X 第三方客户端
一个开源的、注重隐私的 Twitter/X 客户端
pdf-extract-api
一个文档(PDF)提取和解析的API,使用现代OCR技术以及Ollama支持的模型。能够对文档进行匿名化处理,移除个人身份信息(PII),并将任何文档或图片转换为结构化的JSON或Markdown格式
Karing:简单而强大的代理工具
一个简单而强大的代理工具,支持Clash/Sing-box的路由规则
Telegram SMS:在Android设备上运行的短信转发机器人
可以转发短信至Telegram机器人,通知未接电话和设备电量变化,支持通过聊天命令或短信进行远程控制
BiliDownOut:哔哩缓存导出
一个用于导出哔哩哔哩APP离线缓存视频的工具
Cherry Studio:多模型的 GPT 客户端
一个专为专业用户设计的桌面客户端,支持多模型服务,内置超过30个行业智能助手,旨在提升用户在多种场景下的工作效率
web-archive:基于 Cloudflare 的免费网页归档和分享工具
一个网页归档工具,它包括浏览器插件、服务端和Web客户端三个部分。服务端基于Cloudflare Worker,使用D1数据库和R2存储桶。
KMMusicPlayer:简约风 高颜值 Vue Player Music
一款基于 Vue 3.5、Vite 5、Pinia 和 Element-Plus 开发的开源 Web 音乐播放器。它采 用目前最新的技术栈,提供流畅且美观的音乐播放体验
DataBackup:免费且开源的数据备份应用
一款运行在Android 8+的免费开源的数据备份应用
BloomeeTunes
一个跨平台开源音乐播放器,从不同平台访问喜欢的音乐,如 YouTube 和Jio Saavn 提供来自不同来源的无广告音乐
Text Behind Image:图片添加背景文字
一个允许您魔法般地将文本放在照片中的主题背后的工具
Bangumi for Android
由热爱动漫文化的安卓开发者打造,针对BGM.TV打造的一款全新的安卓原生客户端,支持个性化设置,如动态主题等,同时可实现多平台同步,方便用户在不同设备间无缝切换
XiaoMusic: 无限听歌,解放小爱音箱
使用小爱音箱播放音乐,音乐使用 yt-dlp 下载,,支持多种音乐格式,如mp3、flac、wav等,并可以通过语音命令控制播放,如播放指定歌曲、上下曲切换、循环播放等
> pip install -U xiaomusic
> xiaomusic --help
__ __ _ __ __ _
\ \/ / (_) __ _ ___ | \/ | _ _ ___ (_) ___
\ / | | / _` | / _ \ | |\/| | | | | | / __| | | / __|
/ \ | | | (_| | | (_) | | | | | | |_| | \__ \ | | | (__
/_/\_\ |_| \__,_| \___/ |_| |_| \__,_| |___/ |_| \___|
XiaoMusic v0.3.37 by: github.com/hanxi
usage: xiaomusic [-h] [--port PORT] [--hardware HARDWARE] [--account ACCOUNT]
[--password PASSWORD] [--cookie COOKIE] [--verbose]
[--config CONFIG] [--ffmpeg_location FFMPEG_LOCATION]
options:
-h, --help show this help message and exit
--port PORT 监听端口
--hardware HARDWARE 小爱音箱型号
--account ACCOUNT xiaomi account
--password PASSWORD xiaomi password
--cookie COOKIE xiaomi cookie
--verbose show info
--config CONFIG config file path
--ffmpeg_location FFMPEG_LOCATION
ffmpeg bin path
> xiaomusic --config config.json
图片转excel
使用了先进的OCR识别技术,能够精准的识别图片中的表格和文字,并将其还原并转成可编辑的excel文件
橘子下载:免费游戏下载
橘子下载为游戏爱好者提供switch游戏下载,NS游戏下载,任天堂游戏下载等免费下载资源,全部游戏通过免费的网盘下载,免费xci,nsp,nsz,ns格式游戏下载,找最新switch游戏下载就来switch游戏网
Koodo Reader
一个跨平台的电子书阅读器。它支持多种电子书格式,可以在Windows、macOS、Linux和Web上使用。Koodo Reader提供了多种功能,如格式支持、平台兼容性、数据存储与同步、阅读布局、文本转语音、翻译、字典、触摸屏支持、批量导入、书签、笔记、高亮等,以及个性化设置如字体大小、行距、段落间距、背景色、文字颜色等
WUXIAWORLD
一个提供外文奇幻小说的平台,主要是武侠小说和玄幻小说(但是外国版)
SauceNAO
一个反向图像搜索引擎
,网站名来源于网络俚语“Need to know the source of this Now!”
,意思是“现在就要知道这个的来源”
,用户可以通过上传图片或者提供图片的链接来搜索图片的来源和相关信息
screenshot-to-code:截图转代码
一个简单的工具,使用AI将截图、原型和Figma设计转换为干净、功能性的代码。现在支持Claude Sonnet 3.5和GPT-4o
Cerebellum:Selenium x Claude 造就AI驱动的浏览器自动化
一个基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器智能助手。Cerebellum能够智能理解任务,灵活规划行动路径,并通过Sonnet的强大分析能力精准识别网页内容和交互元素,根据变化调整策略。它支持多浏览器(Chrome、Firefox、Safari和Edge),能精确模拟用户行为,应对复杂自动化场景,如数据抓取、网站自动化测试等。核心功能包括图形导航、节点发现和行动决策,用户只需设定目标,大模型将自动处理繁琐的脚本录制工作
阮一峰的技术周刊(非官方)
一个第三方网站基于阮一峰的技术周刊的内容,重新构建一个静态网站,并借助CI实现部署自动化,同时对文本增加检索能力
小红书加微引导图生成器
为了解决小红书引流到微信时,微信号容易被识别的问题,开发了一个在线小红书加微引导图生成器。该工具可以将微信号嵌入图片,生成类似表情包的图片,以规避平台的审查机制
使用方法:输入信息 → 生成图片 → 复制生成的图片 → 粘贴到聊天框发送 → 添加到表情收藏
三角洲行动交易行价格监控和工具
一个可以监控三角洲行动物品价格的网站
开源地址:https://github.com/K12f/df-dicuss
ps. 看了一眼这个开源一行代码没有只有数据
藏趣云书签
一个跨平台的浏览器书签同步助手,创立于2021年初,旨在帮助用户保存和同步书籍、歌曲、文章等浏览内容。该平台提供书签同步、阅读排版、网页标注等功能,并支持定时同步到百度网盘、webDav等。目前,核心服务器已续费五年至2029年11月20日,确保未来五年内平台稳定运行
TShell:智能命令行 SSH 终端应用
TShell 是一个功能强大的可配置命令提示终端模拟器和 SSH 客户端,目前支持以下操作系统:
- Windows
- Mac (arm)
- Linux
AI Summarizer
一个无需复制粘贴,一键生成文章摘要的小工具。网站能支持20多种语言,帮助用户快速获得文章摘要。产品受到用户的喜爱,目前免费开放,未来可能会引入小额收费但核心功能将保持免费。作者强调,知识的获取不应该受到金钱的限制,并期待用户的反馈以进一步改进工具。
so:让 AI 帮你写命令行的命令行工具
一个shell命令工具,该工具能够帮助用户解决忘记命令参数的问题
懒人快速体验:
curl -sSL https://so.pingflash.com/install.sh | sh
Search Tabs:Chrome 的 Ctrl+Shift+A 一样效果
一个简单的 Firefox 插件,它的作用完全复刻了 Chrome 上的 Ctrl+Shift+A 的体验效果
ai-commit:聚合了多种 AI 模型的 git 提交信息生成器
能够使用AI自动生成符合约定的 git 提交信息
V2-tldr:V2EX 话题&评论总结的插件
使用 Gemini API 概括 v2ex 网站上非常长的主题内容并分析讨论的要点
Golf Orbit
一个高尔夫模拟器游戏,玩法很简单 - 用鼠标点击控制力度,把球打得越远越好。有意思的是这游戏还可以把球打到火星去
Buzz
一个能够在个人电脑上离线转录和翻译音频的工具。它由OpenAI的Whisper技术提供支持。Buzz的主要功能是处理音频文件,将其转录成文本,并提供翻译功能,所有操作都在用户的本地计算机上完成,无需联网
NormCap:高效OCR屏幕捕捉工具
一个名为开源、跨平台OCR屏幕捕捉工具
。NormCap通过高效的OCR技术,能够直接从屏幕截图中提取文字,支持Linux、macOS和Windows平台。它基于Tesseract OCR引擎
,提供多种快捷键和自动捕捉功能,以及简单易用的用户界面,使得用户可以快速上手并高效地捕获屏幕上的文字
Ruurd Music
一款基于 Spotify API 的音乐播放器,使用 Electron、Vue 3 和 Vuetify 构建。它允许用户无需 Spotify 高级帐户即可收听 Spotify 音乐库,并且无广告。此外,它还支持添加 YouTube 歌曲,并提供离线播放功能,将每首歌曲保存为带有专辑封面和元数据的 MP3 文件。该播放器还包含许多 Spotify 功能,例如曲目和艺术家电台、个性化主页、类别浏览以及自定义电台生成器
N_m3u8DL-CLI
一个简单易用的m3u8下载器,支持下载m3u8链接或文件为mp4或ts格式,并提供丰富的命令行选项
drawdb:SQL 生成器
一款免费、简单易用的在线数据库图表编辑器和 SQL 生成器。用户无需创建账户即可快速构建图表、导出 SQL 脚本以及自定义编辑器等
Pixel Perfect
一款给图片打分的工具,从构图、情感表达、技术、创意、故事讲述、艺术性和总分的维度进行评估
Adobe Downloader
一款仅支持 macOS 13.0+ 系统的 Adobe 应用下载和安装工具。它提供了一种便捷的方式从 Adobe 官方渠道下载和安装 Acrobat Pro 和其他 Adobe 产品,但需要预先安装 Adobe Creative Cloud 。该工具并非破解版,所有应用均来自官方渠道
在线英文打字练习应用
一个专业的打字训练平台,采用现代化的技术架构和用户友好的界面设计,致力于帮助用户提高英文打字速度和准确性。该应用不仅提供了丰富的练习内容,还配备了专业的数据分析和实时反馈系统
开源地址:https://github.com/wincatcher/typing-practice.toolsnav.top
Qscan:轻量化全方位扫描器
一款比Fscan更快且具备免杀功能的内网扫描器
APIPark:AI 网关
一个开源的、一站式 AI 网关和 API 开发者门户,旨在帮助开发者和企业轻松管理、集成和部署 AI 服务,并促进 AI Agent 的开发。它支持快速接入 100+ AI 模型,简化 AI API 的创建和管理,并提供强大的 API 网关功能,性能比肩 Nginx
CR-Mentor:基于知识库 + LLM 的 Code Review 导师
一个基于知识库和 大型语言模型(LLM) 的代码审查导师,旨在提供智能化和定制化的代码审查指导。它结合了专业知识库和 LLM 的能力,可以提高代码质量,并减少审查时间和错误率
uv:pip的优质竞品
uv 是一个用 Rust 编写的极速 Python 包和项目管理工具,可以替代 pip、pip-tools、pipx、poetry、pyenv、twine、virtualenv 等工具,且相比 pip 有 10-100 倍的运行速度
$ uvx pycowsay 'hello world!'
Resolved 1 package in 167ms
Installed 1 package in 9ms
+ pycowsay==0.0.0.2
"""
------------
< hello world! >
------------
\ ^__^
\ (oo)\_______
(__)\ )\/\
||----w |
|| ||
Flyscrape:网页抓取工具
一个现代化的工具包,用户可以在几分钟内构建自定义抓取器。它能够渲染 JavaScript,使用浏览器的cookies,并且不需要 Node.js 或 Python 等环境。Flyscrape 是一个独立工具,易于设置,支持浏览器模式和 JS 渲染,可以处理依赖 JavaScript 的网站以及具有反机器人措施的网站。它还可以访问个人浏览器的cookies存储,方便抓取需要登录的受保护网站。用户可以精确控制请求处理速度和链接跟踪,以及利用 JavaScript 的强大功能精确提取所需信息。同时提供类似于 jQuery 或 cheerio 的 API 简化 HTML 元素的选择
Auth Wiki
网站介绍了与身份验证和授权相关的各种概念和技术,涵盖了 OAuth 2.0、OpenID Connect (OIDC)、JSON Web Token (JWT) 等关键标准和协议,以及访问控制、单点登录 ( SSO )、多因素身份验证 ( MFA ) 等安全机制。它旨在提供一个全面的 Auth 词汇表,解释每个术语的含义和用途,并提供进一步学习的链接
Transcribro
一款私密的、在设备上运行的语音识别键盘和服务,适用于 Android 系统。该软件使用 whisper.cpp 运行 OpenAI Whisper 家族模型,以及 Silero VAD 进行语音活动检测。它具备语音输入键盘的功能,允许用户通过语音打字,同时其他应用也可使用该服务进行语音转文字
>> 🐱跟着大橘随便看看
- 我的工具:丰富的工具集整理
- library 的某个站点
- Github 摸鱼指北
- Shadowrocket 常用配置/配色文件
- VPS一键脚本合集(持更~)
- Ubuntu开发环境设置
- TaTa-批量图像高清修复/文件提级/批量重命名/音视频小工具
- 全平台 免iTunes下载新旧版ipa 旧版app
- Flux.1 AI Image Generator Free Online
- Bandicam v7.1.4.2458 便携特别版
- 投资课程
- tempmail100:临时邮箱
- 系统设计面试:内幕指南
- 自己动手写 Git
AI 心理问答(初版)LLM 替代真人(下面是微信小程序)
这篇文章来自“Avi Chawla”撰写的“Daily Dose of Data Science”博客,标题为“5 Chunking Strategies For RAG”,发表于2024年10月18日。文章主要讨论了在RAG(Retrieval-Augmented Generation)应用中,如何通过不同的分块策略来处理大型文档,以便更有效地与嵌入模型一起使用
>> 🎵看社区小伙伴们的音乐分享
本期音乐分享整合了我社区小伙伴不同的音乐风格,希望看周刊的各位喜欢,也欢迎你来群里投稿:
- 这世界那么多人(@怀安 推荐)
- 土坡上的狗尾草(@万俊辉 推荐)
- Stay Here Forever Jewel(@柒哥 推荐)
- 梦的光点(@辰 推荐)
- Die For You (为你而战)(@坤坤 推荐)
- 花落人散尽(@宾宾喵 推荐)
- 如瓮(@夜雨为墨,撰把经年说 推荐)
- アスタロア(@Q 推荐)