Mike ks-api 和 ks-jenkins 无任何报错 环境说明:ks 3.1 有多集群 测试用的流水线采用官方例子 仅有几条构建历史 求大神些解决下。 @hongming @Rick @Carsonyang
RolandMa1986 Mike 这个问题可能跟具体环境相关,所以需要你提供更详细的信息,方便其他人供进一步深入排查问题的思路。 请将具体的 api 直接贴出来,这样方便排查。上面截图丢失了这个关键信息。 提供环境信息。比如有几个master节点。jenkins和 ks-apiserver 是否调度在同一节点上。 ks-apiserver 的相关日志,是否有超时相关的问题。 是否有条件自行抓包排查一下环境问题,比如DNS解析,tcp 连接等。
Mike RolandMa1986 ks-api 最近无报错输出,这是之前的一些报错 可以参考下 2.环境信息 1master 4node k8s 版本 1.19.0 网络组件 flanner host-gw 模式 jenkins和 ks-apiserver 不在同一节点 3.直接通过jenkins 管理界面访问都是很快的 4.需要测 ks-api 到 ks-jenkins 的连接 ?能给一个测试示例不?
RolandMa1986 Mike 如果不熟悉tcpdump,就先用curl测试一下 进入ks-apiserver pod, 安装一一下curl,或者自己调度一个POD, 执行: time curl -u {username}:{token} http://ks-jenkins.kubesphere-devops-system.svc/{超时/耗时长的jenkinsAPI} token 可以在浏览器中获取:
Mike RolandMa1986 time curl -u admin:eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VybmFtZSI6ImFkbWluIiwidG9rZW5fdHlwZSI6ImFjY2Vzc190b2tlbiIsImV4cCI6MTYyMzM4ODU5MSwiaWF0IjoxNjIzMzgxMzkxLCJpc3MiOiJrdWJlc3BoZXJlIiwibmJmIjoxNjIzMzgxMzkxfQ.C7XwZj30J4nOY79UxRUyaf2js_botTTkfmvpVPI52bM http://ks-jenkins.kubesphere-devops-system.svc/job/demo-devops7qhfh/job/go-pipeline/ 拼了一个这个地址 你看对不 访问才 2.55s
Mike 请求地址我在 ks-consle 里找到了, ks-consle 里面有如下报错 不知是否有用 我调高了 ks-api ks-console 的初始资源占用 好像快了一点点 默认的值太小了 RolandMa1986
Mike time curl -u ‘admin:eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VybmFtZSI6ImFkbWluIiwidG9rZW5fdHlwZSI6ImFjY2Vzc190b2tlbiIsImV4cCI6MTYyMzM5OTYzNCwiaWF0IjoxNjIzMzkyNDM0LCJpc3MiOiJrdWJlc3BoZXJlIiwibmJmIjoxNjIzMzkyNDM0fQ.AKPwU7OaLUKgcc50a1tfAy0otXy_AEGMCROJVsDnD8E’ “http://ks-jenkins.kubesphere-devops-system.svc/blue/rest/search/?filter=no-folders&limit=10000&q=type%3Apipeline%3Borganization%3Ajenkins%3Bpipeline%3Atest-pipe6l8cd%2F%2A%3BexcludedFromFlattening%3Ajenkins.branch.MultiBranchProject%2Chudson.matrix.MatrixProject&start=0” 这个地址 好像也很快 这种地址可以从哪里取 我多找几个试下
RolandMa1986 Mike 报这个错误很可能是你集群中 dns 有解析超时问题。可以再排查一下。 在console的host 上 运行 ps -aux |grep "node server/server.js" 找到 console 进程的 PID nsenter -n -t{pid} && tcpdump -i eth0 udp 进行抓包。 一般这个ks-apiserver.kubesphere-system.svc 会有三次dns解析。你可以看一下,DNS解析需要平均时间。
Mike RolandMa1986 ks-console 里的报错 请求时间 看上去也是很快的? 这是一次页面请求的 整个upd 抓包过整 持续时间有近10秒 17:49:48.463080—17:49:59.895742 基本就是这样