MoreRSS

site iconchenshake | 陈沙克修改

技术、AI、留学。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

chenshake | 陈沙克的 RSS 预览

家庭网络

2025-01-22 08:00:00

家里的网络很简单,路由器只是负责拨号上网,梯子,基本都是通过设备本身来完成。那么这次在家里长时间,已经感觉很不方便,就投入时间来彻底解决问题。

其实R2S的软路由,在他刚刚发布开发板的时候,我就采购,但是一直懒惰,没有用起来。这次就真的要花时间解决过去几年的各种问题。

需要解决的问题

  • 海外访问家里网络,打开各种ip检查的app的限制。这样对得起家里一年1k的宽带费用
  • 全家设备,无感访问网络。以前我只需要解决我自己的需求,现在需要考虑家人的应用,例如line。
  • 技术上要有点追求,解决各种安全的隐患,例如dns泄漏等。

海外服务器

其实现在海外服务器,价格真的已经很便宜。我使用racknerd 服务器,11美金。现在100人民币一年的vps,选择很多。现在使用的vps,不提供IPv6的地址。

如果你的服务器提供ipv6的地址,那么理论上,你就拥有无限的ipv6地址。通过ipv6访问,是很难拦截你的。

选择vps,要支持ipv6,是一个首选。

这次测试,发现一台vps,1core,1G内存,真的是严重性能浪费。我在digitalocean,启动最低配置的机器,512m内存,跑起来一点都没问题,并且我是在一台vps,跑多个协议,完全没问题,甚至装上3x-ui,性能都是完全够用。

vps端,无论采用web ui(3x-ui)配置,还是自己在服务器上配置,都很简单。

3x-ui,是xray的内核,基本上市场上你看到的各种玩法,都可以在上面实现。并且官方提供的安装脚本,都写出花,啥功能都有。直接给你域名搞出证书,让你第一次访问 UI,就可以实现https。真的不容易,做到这点,真的大大提高安全性。我也是看了 3x-ui 的脚本这个功能,信任它。

目前市场的翻墙新秀是:sing-box。和xray一样,不过目前服务器端端web管理端,还是比较欠缺,s-ui,还是很弱,所以sing-box的各种协议,还是需要自己手搓。不过理解了,其实都简单。

Hysteria, 这是一个协议,做梯子的效果,还是非常好的。尤其线路质量不好的地方。我一直在使用。Hysteria,xray官方表示,不考虑支持,sing-box是支持。

Hysteria,vps上,我就直接部署,没有基于sing-box。这样更加简单。

所以我的vps上,可以理解跑着2套环境,3x-ui和Hysteria。基本基本支持市场上的所有的各种玩法。也仅仅是为了了解和学习。

我的racknerd的vps,价格原因,是不支持ipv6,但是现在你是可以通过ipv6 隧道的方式,获得ipv6的地址。这样的玩法,其实真的突破我的认知,没想到2015年,就有人这样玩。IPv6 Tunnel Broker , 到 https://tunnelbroker.net/ 注册一个账号,简单配置一下,就可以玩起来。

vps支持ipv6,并且ipv6到ip,可不是1个,可以理解成无限,先给vps,搞10个来玩玩。日后连接服务器,就直接用ipv6地址就可以。

目前我的域名注册商,还不支持ipv6解析,真的需要考虑,迁移到CF,解决这个问题。

所以目前VPS端端方案,就比较成熟

  • ipv6+ipv4
  • 3x-ui,xray各种玩法,重点是Reality。也通过cdn,加上xhttp+cdn上行,reality+下行。
  • Hysteria2,直接使用官方脚本搭建,支持ipv6,ipv6优先。

可以说,目前这是一个vps 最优解。

其实我也尝试过在vps上装一个sing-box,一个配置文件,支持3种协议,包括Hysteria2。也是没问题。充分发挥vps的潜力。

OpenWrt

现在的Openwrt和我20年前接触的,已经完全不一样。各种的玩法,眼花缭乱。真的有那么多需求,还是在哪里瞎折腾。

ImmortalWrt, 你基本可以理解,就是OpenWRT的翻版,默认很简洁,和官方一样,就是多一个repo,里面有你所有需要,不需要梯子就可以访问,并且很贴心,提供定制固件。

目前OpenWRT上,有3个解决方案

  • passwall (支持xray,sing-box)
  • openclash
  • homeproxy (只支持sing-box)

我没精力和需求,折腾各种工具,就选择了homeproxy。也确实简单。非常简单,配置就可以搞定上网。专门配置,支持ipv6,这样才能发挥ipv6的优势。

真正挑战的是,解决所谓的DNS泄漏问题。进行测试的时候,肯定能看到国内的dns服务器,很恶心。研究了很久,最后也是用了最优雅的方式,把dns的解析,交给mosdns插件来解决。

非常完美解决的dns泄漏,同时也利用缓存,加快访问速度。

OpenWRT的homeproxy,是使用sing-box,作为客户端来连接到服务器端。解决家庭网络的访问的问题。还同时提供一个server端,让你可以利用公网的ip地址,搭建一个国内的服务器,让海外可以翻回国内。

这个配置起来很简单,海外回国,应该简单很多。

wireguard

大名鼎鼎的vpn软件,其实完也是第一次玩,装openwrt装上,你就可以很简单的方式,访问家里的网络,访问openwrt的管理界面。加上一个ddns,充分把ipv6用起来。感觉很完美。

东南亚的国家,其实都启用了ipv6,很方便通过ipv6连接到国内的家里路由器。openwrt上的wiregrad,使用很简单,各种客户端,你就只需要扫描一个二维码,一切都搞定。

如果国内出门,可以通过wireguard连接家里网络,一切就和你在家里上一样的。海外连接,就慢一点。比在手机上装一个sing-box,好像简单很多。

sing-box能很好支持安卓,apple,免费,也是一个很好的备胎。

sing-box的1.11版本,支持wireguard,应该可以简单很多。

wrt

Mac 第一篇blog

2024-12-22 08:00:00

今天开封mac mini 4, 肯定是最低配置。使用以前家里的键盘,鼠标,显示器跑起来。折腾到现在,基本可以使用。这里就是记录一下。

chrome

如何安装,没有梯子的情况下。家里windows笔记本上可以正常运行梯子,v2rayN,设置一下,让mac mini可以使用他的socks 访问。还需要在mac下,设置Sarari浏览器,使用sockes。mac 设置位置,和windows差异很大。

通过这种方式,先把chrome 装上。

键盘

我是使用dell古老的有线键盘,如何装mac使用,这个比较挑战。最后还是搞定。

github Desktop

有点搞笑,github官网下载回来,默认mac版本,居然是intel,找一下,才找到arm版本下载回来安装使用。这块已经比较熟悉。

comfyui

这个是最有挑战的事情,我是直接安装官方提供的桌面版本。安装比较顺利,装完后,发现无法直接git,需要解决网络的问题。

sing-box

这个工具比较神奇,既是服务器端,又是客户端。 当年刚刚接触电脑的时候,就给这样一句话搞晕。装macos 上是作为客户端使用,就是需要解决一个配置文件的设置。

由于proxy,无法解决git的问题。只能使用TUN,终于最后解决的TUN的问题。服务器端也安装了sing-box,启动服务器版本。

搞定后,很直观,你就可以在comfyui上看到manager。很爽。

vscode

mac下没有notepad++ ,那么就只能替代品,这次就直接vscode,这样更加方便。

Mac 第一篇blog

2024-12-22 08:00:00

今天开封mac mini 4, 肯定是最低配置。使用以前家里的键盘,鼠标,显示器跑起来。折腾到现在,基本可以使用。这里就是记录一下。

chrome

如何安装,没有梯子的情况下。家里windows笔记本上可以正常运行梯子,v2rayN,设置一下,让mac mini可以使用他的socks 访问。还需要在mac下,设置Sarari浏览器,使用sockes。mac 设置位置,和windows差异很大。

通过这种方式,先把chrome 装上。

键盘

我是使用dell古老的有线键盘,如何装mac使用,这个比较挑战。最后还是搞定。

github Desktop

有点搞笑,github官网下载回来,默认mac版本,居然是intel,找一下,才找到arm版本下载回来安装使用。这块已经比较熟悉。

comfyui

这个是最有挑战的事情,我是直接安装官方提供的桌面版本。安装比较顺利,装完后,发现无法直接git,需要解决网络的问题。

sing-box

这个工具比较神奇,既是服务器端,又是客户端。 当年刚刚接触电脑的时候,就给这样一句话搞晕。装macos 上是作为客户端使用,就是需要解决一个配置文件的设置。

由于proxy,无法解决git的问题。只能使用TUN,终于最后解决的TUN的问题。服务器端也安装了sing-box,启动服务器版本。

搞定后,很直观,你就可以在comfyui上看到manager。很爽。

vscode

mac下没有notepad++ ,那么就只能替代品,这次就直接vscode,这样更加方便。

Flux 学习总结

2024-11-28 08:00:00

这几天搞Flux,不停的看视频,看看大家如何使用ComfyUI和Flux,很多工作流,是混合了Stable diffusion和Flux来完成相关的出图,这个其实也导致理解起来比较困难。我就专门找Flux的工作流来理解,这样可以更快了解Flux。

不同阶段,需要,希望了解的内容,是不一样。尤其学习深入后,对原理,也产生的好奇。下面这张原理图,我是对着理解,操作。

总结和理解

  • 文生图,图生图,可以理解流程是基本一致。
  • 生图是第一个阶段,控图是难点,下面主要在生图总结
  • 为了控图:采用了多种的 controlnet技术 ,这是技术发展的重点。
  • Flux扩图,做的非常不错,无需提示词,只需要告诉上下左右,那个方向进行扩图就可以。
  • Flux生图,不受图片尺寸的影响。这点比SD强很多。
  • 很多PS的术语,看多了就熟悉了。例如遮罩,看多就熟悉。
  • 工作流的连接,其实理解原理,操作几遍,就差不多了。最大的问题翻译成中文,搞的很混乱。
  • Flux Lora不需要连接Clip,不需要负面提示词。
  • 目前ComfyUI有好几个采样器,直接使用K采样器就可以。不要给那些所谓高级误导。
  • 使用 自定义采样器(高级),这个在很多工作流都使用,你会发现多一个组件 基础引导
  • 默认Flux工作流,都会有一个Flux引导,可以不添加,默认他的参数:3.5

原理图

下面基本我每次做一个工作流,基本都会复习一遍这个工作流的流程。理解采样器潜在空间

原理图

一个生图模型,可以理解分为3部分

  • CLIP
  • VAE
  • U-net

文生图

搭建一个文生图的工作流,其实折腾了不少时间,主要还是在处理中文和英文的切换,找组件。现在找到一个工作流合集,我打算一个一个分析,整理。 从最简单的开始。流程图是清晰版本,放到,其实是可以对着抄一遍。

提示词

1
2
3
astronaut walking on sunshine, vfx explosions in the background by john carpenter and michael bay, parting the sea, split the moon, summer breeze, big wave, tropical pacific, 80 and 90 psychedelic city pop sfx by haruomi hosono, tatsuro yamashita, shigeru suzuki, yura yura teikoku, shintaro sakamoto, s kitoyaka and omega tribe, makoto matsushita, toshiki kadomatsu
OverallDetailXL 

文生图

对Flux来说,相同的提示词,基本都可以产生不错的效果。就是提示词,写作比较高深。 相信到最后,难度会降低到和Fooocus一样,简单,可控。

这个工作流,和我以前创建的工作流不同的地方:

  • 潜在空间(K采样器) 的参数拆开,可以配置的参数更多,增加了 随机噪波

我把整个工作流,存成模板,如果需要使用,通过 节点预设 ,就可以把当前的工作流创建出来,后续在这个基础上进行优化。

图生图

图生图,其实就把Latent ,换成图片。

图生图

这里面其实会涉及到参数的调整:降噪:从0.5到1.

上面有提示词和参考图片。

  • 降噪设置为:1,参考图片的效果为0,等于文生图。 上面文生图的提示词,继续可以生成一个宇航员的照片。
  • 降噪设置为:0.5, 生成的图片,基本就是原图的复制。
  • 降噪设置为:0.6,到0.8, 生成的图片,会参考原图,进行重绘。

重点

  • 默认的图生图工作流,是不能定义图片的大小,这个工作流,通过引入一个:限制图片区域, 实现输出图片的大小的调整。

  • 图片输入,多了一个VAE Encode 。参考原理图。

文生图+Lora

工作流加Lora,是常态,这个Lora的选择,其实就完全靠经验,多个Lora可以实现串联,不过今天发现:用了Lora,可以大幅减少和降低提示词的难度。

文生图

一个很简单的提示词,通过Trigger Words,就可以实现非常不错的效果。

1
2
An Asian girl, with long black hair and a blue skirt, in the park.:LLL

图推导提示词

上传图片,获取提示词。在工作流里,把图片交给AI模型来识别,达到提示词更加接近原图。

提示词

重点

  • 通过 限制图片区域,限制图片的尺寸,如果图片不超过限制,使用图片的尺寸进行输出,输出给一个 空latent 这里工作流,值得参考。 上面的图生图里,可以加上一个,这样就可以一次生图数量。
  • 加载 Florence2 视觉模型,读取图片信息,把生成的提示词,直接输出给CLIP文本,实现更加准确的提示词。

图推导提示词+Lora

和上面的流程是一样,就是加上了Lora,就出现了一个新的问题,如何输入Trigger Words,去触发Lora。

我就把我的改进,截图保存一下,这才是自己思考验证的地方。在最后输入文本前,进行了文本的合并,并且确认了输出的结果。

触发词

inpaint

这个是在图生图基础上,指定地方,重新生成,例如,脸部,衣服等。

重绘

提示词就填上需要修改内容,我尝试换成项链,没问题,如果效果不好,看看遮罩 重新选择。

这个时候,降噪参数还是1,但是重绘的场景下,传输了遮罩,这时候参考图的权重最高的。

放大

照片高清,有很多方式。通过潜空间来放大,应该是最简单的。原理很简单就是重新在潜空间再运行一次。所以会出现2个k 采样器。

放大

Mac Min 4 Install ConfyUI Flux

2024-11-22 08:00:00

今年给自己准备了一个生日礼物,就是mac-mini 4,16G内存,256G存储空间。 这也算是我个人的第一台mac设备。打算如何折腾呢。先确认一下,运行Flux的效果如何。

准备

git

在mac安装git,需要先安装homebrew 官网地址

安装homebrew

1
2
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

安装git

1
2
brew install git

confyui

现在开源软件安装,官网都写的很详细,照做就基本可以。 Mac安装链接

conda

1
2
curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh
sh Miniconda3-latest-MacOSX-arm64.sh

创建一个confyUI的环境

1
conda create -n confyui python=3.12.4

进入conda

1
coda activate confyui

PyTorch

1
pip3 install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu

验证一下安装是否正常

1
2
3
4
5
6
7
8
import torch
if torch.backends.mps.is_available():
    mps_device = torch.device("mps")
    x = torch.ones(1, device=mps_device)
    print (x)
else:
    print ("MPS device not found.")

正常会看到

1
tensor([1.], device='mps:0')

退出

1
quit()

confyui

安装confyui,非常简单,只需要git下载就可以。目前confyui更新非常快,只能下载master就可以。

1
2
3
git clone https://github.com/comfyanonymous/ComfyUI.git
cd confyui
pip install -r requirement.txt

安装完成后,可以直接运行

1
python main.py

Flux

Flux安装,其实就是把相应的文件,放到指定目录下就可以。

这时候打开 ComfyUI 本地访问地址

把下面照片,保存到本地,上传到ComfyUI上,就可以看到第一条工作流。

官方图片

尝试下面提示词

1
2
8k hi res landscape photograph of a Bavarian castle taken from
a drone

儿子游戏本

2024-11-06 08:00:00

上周和孩子聊天,儿子已经问我如何用N卡,非常专业。因为目前是使用AMD的轻薄本,用的是A卡,不少游戏玩不了。

所以我就决定给儿子去看看目前的市场上的游戏本的情况,尤其国内的笔记本价格,其实肯定比东南亚国家便宜不少。就利用双11, 好好对比学习游戏笔记本的参数。

其实对于一个搞IT的人来说,一台笔记本,涉及的各种参数,也是头晕,也只能系统学习来整理。

最近一周,在研究开源的文生图的软件,发现这些开源软件要本地运行,速度达到可以接受的水平,需要24G显存。目前就只有4090可以满足,这个已经太昂贵了。需要等待明年上半年英伟达的5系列的卡发布。

关注中。看看什么时候笔记本可以支持24G显存的笔记本,价格低于1万的。

看了京东前20的游戏本的配置情况,总结一下我看到的坑。

  • 用12代的cpu,价格可以到5k,采用RTX4060
  • 屏幕165高刷,不能支持240
  • RTX 降低频率运行,降低成本。
  • 16G内存是2*8,已经没有空槽位给你加内存。对办公来说16G内存足够,对于游戏来说32G内存,足够。64G内存,没太多必要性。实在不行,可以32+8的玩法,浪费一条8g内存条。现在估计能买100人民币。

建议

  • CPU i7-14700HX,也是可以选择i7-14650HX。,关键词:酷睿14代
  • GPU RTX 4070 ,关键词:140瓦输出
  • 屏幕:240Hz刷新率,2.5K QHD分辨率,16寸 关键词:240Hz刷新率
  • 内存:16*2=32G
  • 存储:1T

价格,尽量控制在1万以内。

推荐(京东查询的价格)

  • 惠普(HP)暗影精灵10 16.1英寸游戏本笔记本电脑 (酷睿14代i7-14650HX RTX4070 16G 1TBSSD QHD240Hz) 价格:8555.00
  • 惠普(HP)暗影精灵10 16.1英寸游戏本笔记本电脑 (酷睿14代i9-14900HX RTX4070 32G 1TBSSD QHD240Hz) 价格:10979.00
  • 惠普(HP)暗影精灵10 16.1英寸游戏本笔记本电脑 (酷睿14代i9-14900HX RTX4060 32G 1TBSSD QHD240Hz) 价格:9448.00

可以看出一个i9的cpu,比一个i7,贵2000人民币。RTX 4070 比RTX 4060 贵500,选择RTX 4070,还是合算。看下面的参数对比。所以选择8555,再采购一条16G,大概400不到。

游戏本

如果你在某些地区,例如北京,政府补贴,可以上面的价格减掉2k。一下子很多问题都解决了。

office和OS

现在的电脑都会自带Office,记得用一个outlook的账号激活,这样重装才能再次装上office。 默认的windows 11,刚才测试,好像已经可以完美切换英文的版本。office,应该就可以直接更换成英文版本。

以前OEM的home版本,是单一语言,无法更改其他语言,这个麻烦。现在微软直接改变,可以让OEM的home版本,更改语言。这个对于国际学生非常友好。

还有一点,国内购买的笔记本,键盘是全英文,这点还是不错,如果你在别的国家,键盘的帽子是别国语言,有点难受。

CPU

游戏,其实还是INTEL的天下,目前市场上是有13代和14代cpu在销售,这点要注意。已经到了14代的CPU,intel的14代cpu出过所谓的bug,不过还是需要相信intel,bug已经修复。那么cpu,还是继续选择14代的intel。

游戏本cpu,基本都是i7,i9,这个就比较简单,i7肯定是够用。

i7,目前市场上有多种的cpu,不同时间发表,性能和价格,其实差异很大。这点其实是很多老手,例如我,也不敢去中关村买电脑的原因。

  • i7-12800HX (12代cpu), 2022年6月份发布
  • i7-13650HX (13代cpu),2023年第一季度发表
  • i7-14650HX (14代cpu),2024年第一季度发表
  • i7-14700HX (14代cpu) 2024年第一季度发表
参数 i7-13650HX i7-14650HX i7-14700HX
核心数 14 (6P + 8E) 16 (8P + 8E) 16 (8P + 8E)
线程数 20 24 24
基础频率 2.60 GHz 2.20 GHz 2.30 GHz
最大睿频 4.90 GHz 5.20 GHz 5.30 GHz
三级缓存 24 MB 30 MB 30 MB
最大内存 128 GB 192 GB 192 GB
内存类型 DDR4-3200, DDR5-4800 DDR5-5600, DDR4-3200 DDR5-5600, DDR4-3200
TDP 55 W 55 W 55 W
工艺 10nm 7nm 7nm
集成显卡 Intel UHD Graphics Intel UHD Graphics for 14th Gen Intel UHD Graphics for 14th Gen
内存带宽 128 GB/s 157 GB/s 157 GB/s
适用场景 日常使用、轻度游戏 高端游戏、视频编辑 重度游戏、高性能计算

GPU

肯定就是选择N卡,看广告就可以看到一个宣传语:满血,或者高能独显 RTX 4060, 关于满血,什么高能独显含义呢。都是相同的RTX型号显卡,为了解决散热的问题,有的厂商通过控制显卡的功耗给显卡降低频率,这样可以减低成本。

RTX 4060独显,性能释放可达140W 普通 RTX 4060:在笔记本中的默认功耗通常是65W到80W之间,具体取决于厂商的调校和散热能力。

这块选择上需要留意,毫无疑问,必须选择满血,高能独显版本。 释放140瓦性能字样。

下面是目前笔记本上的N卡型号,直接发给gpt,让他进行比较。

  • RTX 4050
  • RTX 4060
  • RTX 4070
  • RTX 4080
  • RTX 4090
参数 RTX 4050 RTX 4060 RTX 4070 RTX 4080 RTX 4090
CUDA核心数 2560 3072 5888 7680 16384
显存容量 6GB GDDR6 8GB GDDR6 12GB GDDR6 16GB GDDR6 24GB GDDR6
显存位宽 96-bit 128-bit 192-bit 256-bit 384-bit
显存带宽 192 GB/s 272 GB/s 504 GB/s 704 GB/s 1008 GB/s
基础频率 1950 MHz 2310 MHz 2175 MHz 2205 MHz 2520 MHz
最大睿频 2460 MHz 2520 MHz 2475 MHz 2505 MHz 2520 MHz
TDP 105W 115W 140W 285W 450W
光线追踪核心数 20 24 46 60 76
张量核心数 80 96 192 240 480
3DMark Time Spy 8681 10969 12048 18000+ 22000+
3DMark Fire Strike 26931 29888 34000+ 45000+ 55000+
3DMark Port Royal 6038 7000+ 8500+ 12000+ 15000+
价格(约) 2300元 2800元 4600元 7999元 12999元
适用场景 日常游戏、轻度创作 中高端游戏、创作 高端游戏、专业创作 旗舰游戏、高性能计算 顶级游戏、专业工作站

输出内容很完整,包括价格和所有的参数。可以看出来,RTX 4070,是一个最佳选择。如果选择4080,游戏本的价格肯定就超过1万,都要到1.5万。

屏幕

保护眼睛是我非常看重的。所以必须好。16寸,应该是比较适合游戏本。下面是他的参数。

  1. 240Hz刷新率
    • 这意味着屏幕每秒可以显示240帧图像,非常适合需要快速响应的游戏或应用程序,能够提供流畅无撕裂的画面体验。
  2. 2.5K QHD分辨率
    • 表示屏幕具有超高的分辨率,具体为2560 x 1440像素,提供了非常细腻和清晰的视觉效果。
  3. 3ms响应时间
    • 指的是从一个颜色切换到另一个颜色所需的时间,单位是毫秒。3ms的响应时间非常迅速,减少了画面拖影现象,适合动态内容的显示。
  4. 100% sRGB色域
    • sRGB是一种标准色彩空间,覆盖了大多数网页和打印媒体的颜色范围。100% sRGB色域意味着该屏幕能够准确再现这一色彩空间内的所有颜色,确保色彩的真实性和一致性。
  5. DC调光
    • DC调光是指通过直接控制电流来调节屏幕亮度,而不是传统的PWM调光方式。这种方式可以减少屏幕闪烁,降低对眼睛的伤害,特别是长时间使用时更加舒适。

综上所述,这款笔记本电脑的屏幕在刷新率、分辨率、响应时间和色彩表现方面都表现出色,并且采用了更健康的DC调光技术,非常适合追求高质量视觉体验和健康使用的用户。

目前只看到HP的游戏本提供240Hz刷新率.我的理解这个参数还是比较重要,尤其对游戏来说。

内存

16G和32G,其实建议选择32G内存。游戏本一般是可以自己加装内存,两根内存槽,这个需要购买前确认。现在DDR 5 16G,一根,300左右,可以接受。

存储

1T容量,足够。