当你敲完 git commit 命令后,究竟发生了什么?
作者:Maxence Poutord
来源:dev.to
翻译:1024译站
如今大多数项目都使用 Git 作为版本控制系统,这意味着大多数项目都有一个.git文件夹。 但是,你有没有尝试过打开它?
我试过一次……然后在一分钟内就关掉了!
长期以来,我都是把 Git 当做“黑盒”来用的。
git explained
“这是GIT。它通过一个漂亮的分布式图论模型跟踪项目中的协作工作。”
“哇,好酷!怎么用的呢?”
“母鸡。只需记住这些 shell 命令并输入它们来同步。如果出现错误,那就把代码保存到其他地方,删掉项目,再下载一份新的。”
直到一年前。我对这种知其然、不知其所以然的做法感到厌倦。最后我找到了机会,开始学习它。 我看了《Pro Git》这本书,并进行了大量实验。我发现它并不像看起来那么复杂!
因此,如果你:
跟上面那张图中的人一样
想了解.git 文件夹里有什么
曾经 "在 git 里弄丢过代码"……
这篇文章就是为你写的!
第一步:Git 数据模型
为了便于理解,我会从一个基础项目开始(有2个文件: index.js and README.md)。
git init
echo "console.log('hi')" >> index.js
echo "# Cool project" >> README.md
git add . && git commit -m "First commit"
现在我们来看看.git 文件夹里的内容:
$ tree .git/objects
.git/objects
├── 2d
│ └── 1a41ebd2d32cb426b6d32e61e063f330aa1af8
├── 66
│ └── 87898e2a0fe2da282efab6b5f7f38b7f788f56
├── c2
│ └── 43f24fb294ebc954b0a7ee6020589245f78315
├── c3
│ └── 0500babf488d06033e8d039cbf64be3edbd089
├── info
└── pack
6 个目录,4 个文件
Git 创建了4个文件。为了避免一个文件夹包含太多文件,git 会自动截取前两个字符作为文件夹名。要检索一个 git 对象,必须将文件夹名+文件名拼接起来。
由于这些文件不具备可读性,你可以用命令git cat-file -p 查看里面的内容(或者用 -t 参数查看类型)。顺便提一下,只能用前 8 个字符。
这些文件是这样互相链接的:
git data model
Git 对象模型有 4 种不同类型:
commit:包含提交人、日期、消息还有目录树
tree:引用其他 tree 和(或)blob
blob:存储文件数据
tag:存储某个提交的引用(本文未涉及)
请注意,blob 不存储文件名(和位置)。这就是为什么当你更改文件位置时 git 会丢失历史记录的原因之一。
?如果你在本机运行,可能会得到不同的 hash 值(作者和日期不一样)!
第二步:第二次提交
现在我们要更新 index.js ,给文件再添加一行:
echo "console.log('world')" >> index.js
git add . && git commit -m "Second commit"
于是又多了 3 个 对象:
$ tree .git/objects
.git/objects
├── 11
│ └── 75e42a41f75f4b25bab53db36d581f72387aa9
├── 2d
│ └── 1a41ebd2d32cb426b6d32e61e063f330aa1af8
├── 66
│ └── 87898e2a0fe2da282efab6b5f7f38b7f788f56
├── c2
│ └── 43f24fb294ebc954b0a7ee6020589245f78315
├── c3
│ └── 0500babf488d06033e8d039cbf64be3edbd089
├── ee
│ └── c2cd5e0b771793e03bbd5f8614c567af964a4e
├── fc
│ └── 512af17ca7ec04be6958047648b32629e4b5a5
├── info
└── pack
9 个目录,7 个文件
现在我们得到这样的结果:
git data model with 2 commits
这里有意思了:Git 并没有存储文件之间的差异!幸亏有packfiles (位于 .git/objects/pack),Git 在硬盘上保留了一个合理的位置。
第三步:乱改一通
在最后一步,我们将添加一个提交。然后,我们将回到过去以“删除此提交”。
echo "console.log('')" >> index.js
git add . && git commit -m "Third commit"
你可能猜到了,git 创建了3个新文件。结构跟第二步的类似。
.git/objects
├── 00
│ └── ee8c50f8d74eaf1d3a4160e9d9c9eb1c683132
├── 09
│ └── f760de83890e3c363a38e6dc0700b76e782bc1
├── cf
│ └── 81d6f570911938726cff95b62acbf198fd3510
└── ...
12 个目录, 10 个文件
现在,我们假装想回退一个提交(git reset HEAD~1 --hard)。
git reset --hard
现在你可能会认为,你搞砸了一切,提交记录再也找不到了。是不是?
可能是。让我们看看还有多少个 git 对象……
$ tree .git/objects
.git/objects
└── ...
12 个目录, 10 个文件
看到没,我们还有10个文件!没有被删!你猜怎么着?如果我用命令git cat-file cf81d6f570911938726cff95b62acbf198fd3510 -p,我还能查看第三次提交的 index.js 文件内容。
"在 git 里你不可能丢失代码。"
——鲁迅
比这更严重的是,我每天使用git push --force,git rebase和git reset --hard,但我从来没有丢失任何东西。但是,我们是人类,人类是容易犯错的。
别担心,如果你想回滚,不用丢弃所有文件。接下来就是见证奇迹的时刻!
reflog:魔术棒✨
如果你尝试使用git log检索历史记录,则不会看到“Third commit” 这个提交。但是,如果加了参数-g(代表 --walk-reflogs),就会看到第三个提交。
为了让结果更好看,你可以用 git log -g --abbrev-commit --pretty=oneline。
这个超有用的命令有个别名:git reflog ❤️
$ git reflog
eec2cd5 (HEAD -> master) HEAD@{0}: reset: moving to HEAD~1
00ee8c5 HEAD@{1}: commit: Third commit
eec2cd5 (HEAD -> master) HEAD@{2}: commit: Second commit
c30500b HEAD@{3}: commit (initial): First commit
(注意:在 .git/logs/HEAD里可以看到类似的结果)
现在,你有了第三个提交的指纹: 00ee8c5。你可以用 git reset 00ee8c5 --hard 来撤销之前的重置。
注意事项:
在某些情况下,git reflog 对你没有帮助:
当你拉取别人的代码
当你删除仓库并重新克隆
当你查找超过90天前的改动(被git gc清理掉了 )。我不知道你们的情况,反正我连一个月前做了啥都不记得了。所以记录保存3个月应该足够了。
另外,如果你像 ctrl + s一样使用 git commit,就可能很容易犯迷糊。很抱歉,除了建议你阅读我的那篇有关 conventional commits 的文章外,我也无能为力。我认为这是使用 git 最干净的方法。
总结
有4种不同类型的 git 对象:commit,tree,blob 和tag
blob 并不存储文件名(这就是为什么移动文件后会丢失历史)
Git 不存储文件差异
提交后的代码不会丢失。git reflog 能帮到你。
今天就到这里,下课!
外链:http://kaysonli.com/2019/12/19/git-commit-under-the-hood/
获取更多技术趋势和资源,欢迎关注微信公众号:1024译站
微信公众号:1024译站
发表评论 (审核通过后显示评论):